
تشخیص اسپم در ایمیل های فارسی عنوان داکیومنتی است که در این پست به آن پرداخته شده است. در یک دهه گذشته، با گسترش سریع اینترنت ایمیلها یکی از سریعترین و مقرون به صرفهترین و راحتترین راههای ارتباطی شدهاند. امروزه ایمیلها در اینترنت به صورت نمایی در حال افزایش میباشند، اما متاسفانه کارایی و ماهیت اقتصادی ایمیلها مورد سوءاستفاده قرار گرفته است.
تهیه و تنظیم: تیم طراحی و تولید پی استور
متشکل از اساتید و فارغ التحصیلان رشته های فنی - مهندسی
تیم طراحی و تولید پی استور از اولین تیم های تشکیل شده در مجموعه آموزشی پی استور می باشد. این تیم از اساتید مجرب و فارغ التحصیلان رشته های فنی و مهندسی تشکیل شده که در زمینه های مختلف تولید محتوای تخصصی فعال هستند.
در دنیای واقعی ایمیلها به دو دسته ایمیلهای قانونی و ایمیلهای اسپم یا ناخواسته تقسیم میشوند. ایمیلهای قانونی در بیشتر موارد دارای محتوای مفید و کاربردی میباشد و برای کاربر مفید میباشد، اما ایمیلهای اسپم در اکثر موارد دارای محتوای غیرمفید و اغلب زاید میباشند. تشخیص اسپم در ایمیل را می توان با استفاده از الگوریتم های یادگیری ماشین انجام داد.
برای این کار ابتدا لیستی از ایمیل های قانونی و اسپم تهیه می شود سپس با آموزش از طریق الگوریتم های یادگیری می توان به تست و تجزیه تحلیل اسپم یا قانونی بودن ایمیل پرداخت.
در این پست داکیومنت تشخیص اسپم در ایمیل های فارسی در 135 صفحه در قالب Word گذاشته شده است. این محصول با بهترین کیفیت مناسب برای داکیومنت نویسی، سمینار، تحقیق کلاسی است. در ادامه چکیده و فهرست مطالب این اثر آمده است.
اسپم در ایمیل چیست
امروزه بیشتر ارتباطات مردم از طریق نامههای الکترونیکی یا همان ایمیلها میباشد. عموما همهی افراد ایمیلها را به دو دسته یا کلاس ایمیلهای اسپم و ایمیلهای قانونی دستهبندی میکنند. کلاس اسپم به کلاسی گفته میشود که معمولا دارای محتوای غیرمفید و شاید مضر میباشد و کلاس ایمیلهای قانونی کلاسی است که در اغلب موارد دارای محتوای مفید برای کاربر بوده است.
در این پژوهش میخواهیم ایمیلهای فارسی را به جای دستهبندی به دو کلاس اسپم و غیر اسپم به سه کلاس اسپم، غیراسپم و میانی تقسیم و دقت دستهبندی را بررسی کنیم. کلاس سوم را با نام کلاس میانی عنوانگذاری کرده و در تعریف این کلاس میگوییم، در این دسته وقتی کاربر ایمیل را در صندوق ورودی خود دریافت میکند نمیتواند در نگاه اول دستهی این نوع ایمیل را تشخیص داده چون آن ایمیل از از نظر برخی اسپم واز نظر برخی دیگر غیراسپم میباشد.
برای انجام اینکار مجموعهدادهای از ایمیلها را بهصورت سه کلاسه جمعآوری کردیم و با توجه به اینکه در اکثر موارد بدنه و عنوان ایمیل به صورت متن میباشد، بنابراین از روشهای دستهبندی متون مانند الگوریتم نیوبیزین، ماشین بردار پشتیبان و k همسایه نزدیک استفاده شد.
برای بررسی اثر سهکلاسه کردن ایمیلهای فارسی از معیارهای دقت، فراخوانی و Fاستفاده کردیم. برای حالت سه کلاسه نتایج به دست آمده برای روش نیوبیزین 275/86٪، 22/86٪ و 875/83٪ (به ترتیب برای دقت، فراخوانی و F) و برای ماشین بردار پشتیبان25/85٪، 175/85٪ و 175/81٪ و برای وK همسایه نزدیک925/84٪، 075/85٪ و 875/80٪ بود.
برای حالت دو کلاسه نیز نتایج به دست آمده برای روش نیوبیزین 425/93٪، 825/92٪ و 775/92٪ (به ترتیب برای دقت، فراخوانی و F) و برای ماشین بردار پشتیبان 3/83٪، 925/84٪ و 8/84٪ و برای وK همسایه نزدیک575/89٪، 875/86٪ و 575/86٪ بود.
فهرست مطالب در تشخیص اسپم در ایمیل
فصل اول مقدمه و کلیات پژوهش
- مقدمه
- شرح مسئله
- ضرورت انجام تحقیق
- اهداف تحقیق
- روش تحقیق
- نوآوری های تحقیق
- ساختار پایاننامه
فصل دوم انواع روشهای دستهبندی متن
- مقدمه
- تعاریف پایه
- ساختار ایمیل
- تعریف اسپم
- مشخصات اسپم
- نمونههایی از ایمیلهای اسپم انگلیسی
- دسته بندی
- مرحله پیش پردازش
- توکن بندی
- حذف جمعهای فارسی
- حذف پسوند ها و پیشوند ها
- ریشه یابی
- حذف کلمات ایست یا توقف یا زاید یا کلمات سراسری یا کلمات بی ارزش
- نمایش متون
- انتخاب خصیصه یا ویژگی
- همبستگی بین خصیصه ها و دسته ها
- روش های انتخاب ویژگی یا خصیصه
- روش های فیلتری یا آماری
- روش های روکشی
- الگوریتم های دسته بندی متن
- روش نیوبیزین
- روش ماشین بردار پشتیبان
- روش kهمسایهی نزدیک
- روش شبکه های عصبی
- روش درخت تصمیم
- معیارهای ارزیابی
- نرم افزار وکا
- جمع بندی فصل
فصل سوم سه کلاسه کردن ایمیلهای فارسی
- مقدمه
- سه تعریف مهم برای روش پیشنهادی
- نمونه ای از هر کدام از ایمیلها قبل از برچسبگذاری
- تشکیل مجموعه داده ی ایمیل آموزشی و ایمیل تستی
- روش پیشنهادی
- جمع بندی فصل
فصل چهارم آزمایشها و نتایج
- مقدمه
- جمعآوری مجموعه داده
- تعیین تعداد ایمیل و تعداد ویژگی ها
- آزمایش برای تعیین تعداد ایمیل و خصیصه بر اساس معیار دقت
- تعیین بهترین تعداد ایمیل و تعداد ویژگی برای معیار دقت برای سه کلاسه کردن
- آزمایش برای تعیین تعداد ایمیلها و تعداد خصیصههای مناسب بر اساس معیار فراخوانی
- تعیین تعداد ایمیلها و تعداد خصیصههای مناسب بر اساس معیار ارزیابی
- تعیین بهترین تعداد ایمیل و خصیصه برای سه کلاسه کردن ایمیلهای فارسی
- تعیین معیارTP و FP برای حالت سه کلاسه در ایمیلهای فارسی
- بهترین روش برای سه کلاسه کردن ایمیل های فارسی بر اساس معیار دقت، معیار فراخوانی
- جمع بندی فصل
فصل پنجم نتیجهگیری و کارهای آتی
- نتیجه گیری
- کارهای آتی
مراجع و منابع
پیوستها
پیوست یک (پ1 ): لیست کلمات توقف فارسی
پیوست 2 (پ 2): جدولها
پیوست 3 لیست واژگان
درباره تشخیص اسپم در ایمیل
این محصول داکیومنت بررسی اثر سه کلاسه کردن دستهبندی بر روی دقت تشخیص اسپم در ایمیل های فارسی که به صورت ساده و روان در 135 صفحه در قالب ورد بصورت نگارش آکادمیک کامل فارسی منتشر شده است. این داکیومنت توسط کارشناسان پی استور بررسی و تایید شده است. محصول دارای نشان تضمین کیفیت پی استور می باشد. برای دانلود محصول آن را خریداری کنید.
مطالب پیشنهادی دیگر برای شما
تاریخ انتشار: | 26 فروردین 1397 |
---|---|
تاریخ بروزرسانی: | 6 شهریور 1397 |
حجم فایل: | 1 مگابایت |
فرمت فایل | docx با قابلیت ویرایش |
نسخه: | 1.0 |
هماهنگی با: | Microsoft Word 2007 و بالاتر |
تاکنون 241 نفر این محصول را تهیه کرده اند و 1 نظر برای آن ثبت شده است.
نظرات و دیدگاه ها
قوانین ثبت دیدگاه
- لطفاً دیدگاه های خود را فارسی تایپ کنید.
- دیدگاه های نامرتبط به مطلب تایید نخواهد شد.
- از درج دیدگاه های تکراری پرهیز نمایید.
- سوالات تخصصی خودتان را از طریق تیکت پشتیبانی مطرح کنید.
قیمت 179,000 تومان
تاریخ انتشار: | 26 فروردین 1397 |
---|---|
تاریخ بروزرسانی: | 6 شهریور 1397 |
حجم فایل: | 1 مگابایت |
فرمت فایل | docx با قابلیت ویرایش |
نسخه: | 1.0 |
هماهنگی با: | Microsoft Word 2007 و بالاتر |
1 بازخورد (مشاهده نظرات)
قیمت: 179,000 تومان
مدیریت و پشتیبانی
نظرات و دیدگاه های خود را با ما درمیان بگذارید.