داکیومنت دسته بندی متون احساسی با ویژگی های Bigram مبتنی بر الگوریتم تکاملی

در این پست داکیومنت دسته بندی متون احساسی با ویژگی های Bigram مبتنی بر الگوریتم تکاملی قرار گرفته شده است. ضرورت استفاده از سیستم‌های تشخیص خودکار بر کسی پوشیده نیست. الگوریتم‌های یادگیری ماشین به‌صورت فراوانی هزینه تحقیق را کاهش می‌دهند و سرعت بسیار بیشتری نسبت به الگو های میدانی دارند و بدین‌صورت صرفه‌جویی زیادی در وقت می‌شود. مشکلی که در دسته‌بندی متن یا دسته بندی متون وجود دارد، حجم زیاد ویژگی‌ها است که باعث کاهش دقت نتایج دسته‌بندی می‌شود.

برای انتخاب ویژگی در اسناد متنی از متدهای انتخاب ویژگی n-gram استفاده می‌کنند در این روش n تعداد کلمات انتخاب شده را بیان می‌کند. دو روش تک کلمه‌ای و دو کلمه‌ای در بیشتر پژوهش‌ها مورد توجه قرار گرفته است. در روش تک کلمه‌ای (unigram) ویژگی‌های یک متن با توجه به تعداد آن‌ها بدست ‌می‌آید ولی در روش دو کلمه‌ای (Bigram )تعداد حالت‌هایی که دو کلمه در کنار هم می‌آیند را به دست می‌آورند و ویژگی‌های دوکلمه‌ای با شمارش و تکرار بالا به‌عنوان ویژگی در نظر گرفته می‌شود.

اما مشکل اصلی در انتخاب ویژگی‌های موثر در دسته بندی متون است بدین معنی که فرکانس بالای کلمات فقط تنها عاملی برای انتخاب ویژگی نیست.  با توجه به حجم بالای ویژگی‌ها در مسئله دسته‌بندی متون می‌توان گفت انتخاب ویژگی‌های مؤثر برای دسته‌بندی متن، یک مسئله NP-Hard است و می‌توان با استفاده از الگوریتم‌های تکاملی آن را حل کرد

 

چکیده

با پیشرفت علم حجم اسناد متنی موجود بر روی رسانه‌های دیجیتال و اینترنت، افزایش یافته است و این موضوع ضرورت استفاده از سیستم‌های خودکار تشخیص و دسته‌بندی متن را بیشتر پررنگ می‌کند. روش‌های دسته‌بندی متن جزو روش‌های یادگیری ماشین هستند و استخراج و انتخاب ویژگی مرحله‌ی بسیار مهم در رویه‌ی دسته‌بندی متون به شمار می‌رود، زیرا در این مرحله واژه‌های کلیدی انتخاب می‌شوند تا به‌عنوان بهترین نمایش‌دهنده برای سند متنی مورد استفاده قرار بگیرند.

هدف روش‌های انتخاب ویژگی به دست آوردن یک مجموعه‌ی کوچک‌تر از ویژگی‌های موجود در سند می‌باشند که به طرز مؤثری محتوای سند را بیان می‌کند. الگوریتم‌های مختلفی برای دسته‌بندی متون وجود دارد. مشکلی که در دسته‌بندی متن وجود دارد، حجم زیاد ویژگی‌ها است که باعث کاهش دقت نتایج دسته‌بندی می‌شود. برای انتخاب و برای حل این مشکل و کاهش ابعاد ویژگی‌ها از متدهای انتخاب ویژگی استفاده می‌کنند انتخاب ویژگی‌های مؤثر برای دسته‌بندی یک مسئله NP-Hard است و می‌توان با استفاده از الگوریتم‌های تکاملی آن را حل کرد.

در این پایان‌نامه یک روش ترکیبی مبتنی بر الگوریتم ژنتیک و شبیه‌ساز حرارتی برای به دست آوردن ویژگی‌های مؤثر استفاده‌شده است که بر روی متن 25000 فیلم که در دو دسته مثبت و منفی دسته‌بندی شده‌اند طراحی‌شده است. این دسته‌بندی مربوط به بررسی احساسات در فیلم‌ها است. با استفاده از روش داده‌کاوی متن و استخراج ویژگی‌ها مراحل پیش‌پردازش جهت به دست آوردن ویژگی‌ها از دو روش Unigram و Bigram استفاده‌شده و ویژگی‌های دوکلمه‌ای با شمارش و تکرار بالا به‌عنوان ویژگی‌های با اولویت بالا در نظر گرفته‌شده است نتایج حاصل از شبیه‌سازی نشان داد دسته‌بندی با صحت و دقت بالای 90 درصد انجام‌شده است. روش درخت تصمیم بهینه‌شده با الگوریتم ژنتیک و شبیه‌ساز حرارتی با دقت 93.15 دسته‌بندی را انجام داد.

کلمات کلیدی: دسته‌بندی متن، انتخاب ویژگی مؤثر، الگوریتم‌های یادگیری ماشین، الگوریتم‌های تکاملی

 

فهرست مطالب

 

فصل اول: کلیات تحقیق

1-1 مقدمه

1-2 نگرش و اهمیت انتخاب موضوع

1-3 بیان مسئله

1-4 اهداف تحقیق

1-5 نظریه

1-6 نوآوری‌های تحقیق

1-7 ساختار پایان‌نامه

فصل دوم: مفاهیم پایه و پیشینه تحقیق

2-1 مقدمه

2-2 روش‌های دسته بندی

2-2-1 ‌مرحله پیش پردازش

2-2-2 انتخاب ویژگی

2-3 روش های انتخاب ویژگی

2-3-1 روش های فیلتری یا آماری

2-3-2 روش های روکشی

2-4 الگوریتم های دسته بندی متن

2-4-1 روش نیوبیزین

2-4-2 روش ماشین بردار پشتیبان

2-4-3 روش k همسایه‌ی نزدیک

2-4-4 روش شبکه های عصبی

2-4-5 روش درخت تصمیم

2-5 الگوریتم‌های تکاملی

2-5-1 الگوریتم ژنتیک

2-5-2 الگوریتم شبیه‌ساز حرارتی

2-6 مرور کارهای پیشین

2-7 خلاصه فصل

فصل سوم: روش پیشنهادی

3-1 مقدمه

3-2 روش پیشنهادی

3-2-1 مرحله‌ی GA

3-2-2 مرحله‌ی SA

3-3 مجموعه داده

3-4 خلاصه فصل

 

فصل چهارم: ارزیابی نتایج

 

4-1 مقدمه

4-2 معیارهای ارزیابی

4-3 آزمایش و ارزیابی

4-3-1 الگوریتم شبکه‌های عصبی

4-3-2 الگوریتم درخت تصمیم

4-3-3 الگوریتم K همسایه نزدیک

4-3-4 الگوریتم نیو بیزین

4-3-5 الگوریتم ماشین بردار پشتیبان

4-4 جمع‌بندی فصل

فصل پنجم: نتیجه‌گیری و کارهای آتی

5-1 نتیجه گیری

5-2 کارهای آتی

 

درباره محصول

داکیومنت دسته بندی متون احساسی با ویژگی های Bigram مبتنی بر الگوریتم تکاملی در 70صفحه در قالب word و pdf بصورت زیپ شده قابل دانلود می باشد. این محصول به صورت کامل و روان داکیومنت است و توسط کارشناسان پی استور بازنگری و تایید شده می باشد. این محصول دارای نشان تضمین کیفیت پی استور می باشد. برای دانلود محصول آن ر ا خریداری فرمایید. به محض خرید محصول لینک دانلود در دسترس خواهد بود. در صورت بروز هرگونه مشکل با واحد فروش پی استور تماس حاصل فرمایید.

79,000 تومان

1 دیدگاه برای دسته بندی متون احساسی با ویژگی های Bigram مبتنی بر الگوریتم تکاملی

  1. programstore

    نظرات و دیدگاه های خود را با ما درمیان بگذارید.

دیدگاه خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.