روش‌های تشخیص اسپم و فیلترینگ

روش‌های تشخیص اسپم و فیلترینگ در داده کاوی یکی از چالش های مهم می باشد. در این راه، مشخصات ذاتی ایمیل مورد توجه واقع می شوند و تصمیم گیری بر اساس آنها صورت می گیرد. تقریبا تمام این روش ها از یادگیری ماشین استفاده می کنند. دسته بندی یکی از راه های مقابله با اسپم در سیستم های امروزی است که با استفاده از الگوریتم های یادگیری ماشین همچون نیو بیزین، ماشین بردار پشتیبان، شبکه های عصبی، درخت تصمیم و غیره انجام می گیرید. در ادامه چکیده سمینار روش‌های تشخیص اسپم و فیلترینگ آمده است. کیفیت محتوای این سمینار توسط پی استور تضمین می گردد و شما می توانید با خیال راحت محصول را خریداری نمایید.

روش‌های تشخیص اسپم و فیلترینگ

چکیده

از سال‌های اخیر، ایمیل‌ها به عنوان ابزاری برای ارتباطات سریع و غیرهمزمان مورد استفاده می‌باشند که رشد سریع ایمیل‌ها و هزینه‌ی کم آن‌ها باعث شده تا برخی افراد از آن‌ها سوء‌استفاده کنند و شروع به ارسال ایمیل‌های بیهوده تحت عنوان اسپم کنند. امروزه ایمیل‌های اسپم یک مسئله در حال افزایش می‌باشد که باعث یک اثر اقتصادی در جامعه شده است.

اسپم‌ها علاوه بر آزار و اتلاف وقت کاربران، باعث اتلاف پهنای باند و منابع شبکه و ترافیک در شبکه می‌شود، که برای حل این مشکل روش‌های زیادی وجود دارد که یکی از این روش‌ها فیلترینگ می‌باشد. از آن‌جایی که الگوریتم‌های زیادی برای فیلترینگ اسپم وجود دارد ما در این پژوهش فقط الگوریتم‌های یادگیری ماشین را بازگو خواهیم کرد.

در این پژوهش در ابتدا به تعریف اسپم‌ها و مشخصات و مشکلاتی که اسپم‌ها ایجاد می‌کنند می‌پردازیم و در ادامه چگونگی استفاده از انواع الگوریتم‌های یادگیری ماشین برای فیلترینگ اسپم گفته خواهد شد. از آن‌جایی که معیارهای زیادی برای مقایسه‌ی این الگوریتم‌ها و این که کدام یک نسبت به دیگری بهتر بوده و کارایی بالاتری دارد و اسپم را بهتر تشخیص داده و فیلتر می‌کند وجود دارد اما ما از این بین، از سه معیار ارزیابی Accuracy, Recall, precision استفاده می‌کنیم.‌ برای مقایسه این معیارها آزمایش‌هایی انجام شده و نتایجی بدست آمده که ما این نتایج را در ادامه خواهیم گفت.

 

فهرست مطالب
فصل اول: مقدمه

1-1 مقدمه

1-2 شرح مسئله

1-3 ضرورت انجام تحقیق

1-4 ساختار سمینار

فصل دوم: تعریف اسپم و مشخصات آن‌ها

2-1 مقدمه

2-2 تعاریف پایه

2-3 ساختار ایمیل

2-4 تعریف اسپم

2-5 مشخصات اسپم

2-6 نمونه‌هایی از ایمیل‌های اسپم

2-7 مشکلات ایمیل‌های اسپم

2-8 انواع اسپم

2-8-1 نامه‌های زنجیره‌ای و حیله‌های اینترنتی

2-8-2 طرح‌های هرمی

2-8-3 طرح کلاهبرداری مالی

2-8-4 اسپم‌های تجاری

2-9 مبارزه با اسپم

2-9-1 اقدامات قانونی در برابر اسپم

2-9-2 اقدامات فنی

2-10 فیلترهای عملی اسپم

2-10-1 فیلترینگ سمت سرور در مقابل فیلترینگ سمت کلاینت

2-10-2 قرنطینه کردن

2-10-3 پروکسی و برچسب‌گذاری

2-11 فیلترینگ اسپم

2-12 روش‌های فیلترینگ اسپم

2-13 فیلترینگ بر اساس محتوا

2-14 جمع‌بندی

فصل سوم: الگوریتم‌های یادگیری ماشین برای فیلترینگ اسپم

3-1 مقدمه

3-2 الگوریتم‌های یادگیری ماشین برای فیلترینگ اسپم

3-2-1 شبکه‌های عصبی

3-2-2 ترکیب شبکه عصبی و رگرسیون خطی

3-2-3 مدل کردن رفتار اسپمر شبکه عصبی در برابر Naïve Bayesian

3-3 الگوریتم SVM

3-3-1 روش SVM وزن‌دار

3-3-2 روش WSK(Word Sequence Kernel)

3-3-3 روش SVM با مجموعه آموزشی کوچک

3-3-4 ترکیب SVM با الگوریتم ژنتیک

3-4 درخت تصمیم Decision Tree

3-4-1 الگوریتمID3

3-4-2 الگوریتم CART

3-4-3 الگوریتمJ48

3-4-4 الگوریتم AD Tree

3-4-5 الگوریتمDecision tree و Ensemble learning

3-5 جمع‌بندی

فصل چهارم: نتیجه‌گیری

4-1 جمع‌بندی

4-2 کارهای آتی

مراجع و منابع

1 دیدگاه برای روش‌های تشخیص اسپم و فیلترینگ آن

  1. امتیاز 5 از 5

    programstore

    نظرات و دیدگاه های خود را با ما درمیان بگذارید.

دیدگاه خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.

اطلاعات فروشنده