
در این پست متن پایان نامه ای با عنوان انتخاب ویژگی با الگوریتم گرگ خاکستری جهت افزایش دقت خلاصه سازی متن بر خط قرار داده شده است. انتخاب ویژگی معمولاً برای کاهش ابعاد مجموعه داده و افزایش دقت در الگوریتم های یادگیری ماشین استفاده می شود. در این پایانامه انتخاب ویژگی با الگوریتم گرگ خاکستری برای کاهش ابعاد و همچنین افزایش دقت در متن کاوی با الگوریتم یادگیری ماشین KNN و همچنین روش اطلاعات متقابل MUTUAL INFORMATION در نظر گرفته شده است.
این پایانامه در 138 صفحه در قالب Word و PDF برای علاقه مندان در حوزه متن کاوی و استخراج ویژگی ای موثر از دیتاست آماده شد است همچنین پاورپوینت ارائه این پایانامه با عنوان پاورپوینت انتخاب ویژگی با الگوریتم گرگ خاکستری برای متن کاوی در همین سایت قرار داده شده است. در ادامه به بررسی خلاصه وار از قسمت ای مهم این پایان نامه پرداخته می شود.
تهیه و تنظیم: تیم طراحی و تولید پی استور
متشکل از اساتید و فارغ التحصیلان رشته های فنی - مهندسی
تیم طراحی و تولید پی استور از اولین تیم های تشکیل شده در مجموعه آموزشی پی استور می باشد. این تیم از اساتید مجرب و فارغ التحصیلان رشته های فنی و مهندسی تشکیل شده که در زمینه های مختلف تولید محتوای تخصصی فعال هستند.
چکیده
خلاصهسازی متن یکی از کارهای اساسی در بازیابی متون در اسناد است. یکی از راهکارهای اساسی در خلاصه سازی متن استفاده از تکنیکهای متنکاوی است. متن کاوی یکی از زیر شاخههای اساسی در دادهکاوی و یادگیری ماشین است. روش پیشنهادی از ترکیب روشهای پالایش و لفافه برای انتخاب ویژگی استفاده میکند. در فاز پالایش انتخاب ویژگی به کمک اطلاعات متقابل و در فاز لفافه انتخاب ویژگی با الگوریتم گرگ خاکستری و الگوریتم طبقه بند k نزدیکترین همسایه صورت میگیرد.
از KNN برای محاسبه برازندگی عاملها در GWO استفاده میشود. هدف از ترکیب روشهای لفافه و فیلتر این است که به طور همزمان سرعت و دقت روش پیشنهادی برای انتخاب ویژگی بالا برود. نتایج به دست آمده نشان دادند که روش پیشنهادی کارایی خوبی داشته است و انتخاب ویژگی میتواند کارایی نهایی مدلهای طبقهبند را بهبود بخشد.
واژه های کلیدی: خلاصه سازی متن، داده کاوی، متن کاوی، الگوریتم گرگ خاکستری، روش اطلاعات متقابل، یادگیری ماشین
مقدمه
با رشد سریع تکنولوژی های تبادل اطلاعات، حجم زیادی از داده های الکترونیکی در دنیای وب و کتابخانههای دیجیتال تولید و جمع آوری شده است و سالانه 30 درصد نیز به حجم این داده های الکترونیکی افزوده می شود. این انفجار داده های الکترونیکی، استخراج اطلاعات را برای کاربران بسی مشکل ساخته است.
ایده خلاصه سازی خودكار متن نیز به اواخر دهه 1950 میلادی معطوف می شود. طی این سال ها تلاش های بسیاری برای رسیدن به این هدف انجام گرفت در. این راستا هم از اطلاعات سطح پایین (اطلاعات آماری) و هم از اطلاعات سطح بالای (مدل های دامنه ای) موجود در اسناد استفاده شد، اما حاصل یك نتیجه تقریبی از خلاصه یك متن بود كه با نمونه های انسانی فاصله مشهودی داشت. البته امروزه نیز ساخت یك سیستم خلاصه ساز توانا كه خلاصه های بسیار خوانا تولید كرده و نتایج بسیار قانع كننده ای داشته باشد، فرآیند بسیار پیچیده ای خواهد بود.
فهرست مطالب
فصل اول: بررسی منابع
- بیان مسأله
- اهمیت و ضرورت تحقیق
- پردازش زبان طبیعی
- خلاصه سازی خودكار متن
- اهمیت و لزوم خلاصه سازی
- فرایند خلاصه سازی
- انواع خلاصه
- نوع منبع ورودی
- خلاصه خروجی
- هدف خلاصه سازی
- سیستم های خلاصه ساز را براساس سطوح مختلف پردازش متن
- روش سطحی
- روش معنایی
- روش ترکیبی
- مراحل اصلى خلاصه سازى استخراجى
- برچسب زنى کلمات
- رویکرد مبتنى بر قواعد
- رویکرد آمارى مبتنى بر مدل هاى مارکوف
- رویکرد ماکزیمم آنتروپى
- سابقه تحقیق
- نوآوری تحقیق
- اهداف تحقیق
- هدف اصلی
- هدف فرعی
- فرضیه های تحقیق
- سوالات تحقیق
- روش انجام تحقیق
- تعاریف
- خلاصه سازی متن
- زبان طبیعی
- ساختار پایان نامه
فصل دوم: مواد و روش ها
- مقدمه
- مراحل خلاصه سازی
- پیش پردازش متن
- تجزیه مورفولوژی
- رفع ابهام
- تشخیص و حذف کلمه های بی اثر
- ریشه یابی کلمات و یافتن کلمات کلیدی
- پردازش متن خلاصه استخراجی
- روش سطحی
- روش موجودیتی- معنایی
- روش هم مکانی
- روش های مبتنی بر گراف
- روش های زنجیره لغوی
- سطح کلامی
- روش ترکیبی
- خلاصه استخراجی
- روش های بر پایه پردازش سطحی
- روش های بر پایه کلمات و مکان
- خلاصه ساز GistSumm
- روش lead based
- خلاصه ساز FarsiSum
- روش های موجودیتی بر پایه معنی
- استفاده از زنجیره لغوی
- روش های بر پایه گراف
- روش Text Rank
- روش های بر پایه هم مکانی
- روش های بر پایه ساختار کلامی
- روش های بر پایه آموزش یادگیری
- ترکیب روش سطحی و معنایی
- روش افزایش و کاهش جمله
- روش بر پایه هستان شناسی
فصل سوم: نتایج و بحث
- مقدمه
- معرفی گرگ خاکستری
- مدل ریاضی و الگوریتم
- ماشین های بردار پشتیبان (SVM)
- طبقه بندی ماشین بردار پشتیبان
- دسته بندی خطی داده های دارای نویز
- حالتی که داده ها به صورت خطی جدا نشوند
- طبقه بندی ماشین بردار پشتیبان
- مراحل انجام پایاننامه
فصل چهارم: روش پیشنهادی
- مقدمه
- اجزای روش پیشنهادی
- پردازش متن
- پیشپردازش
- استخراج ویژگی
- ویژگی های لغوی
- وزندهی به ویژگیها
- کاهش ابعاد دادهها
- انتخاب ویژگی با اطلاعات متقابل
- انتخاب ویژگی به کمک الگوریتم گرگ خاکستری
- محاسبه برازندگی عاملها
- الگوریتم طبقهبند نزدیکترین همسایه
- مجموعه داده مورد استفاده
- نتیجه گیری
- ارزیابی روش پیشنهادی
فصل پنجم: نتیجه گیری و ارزیابی نتایج
- مقدمه
- ارزیابی روش پیشنهادی
- تقسیمبندی داده ها
- معیارهای ارزیابی
- نتایج به دست آمده
- تعداد ویژگیهای استخراج شده
- تعداد ویژگیهای انتخاب شده
- نتایج بر اساس معیارهای کارایی
- مقایسه نتایج
- مقایسه با سایر کارها
- نتیجه گیری و پیشنهادات کارهای آتی
منابع
فلوچارت روند کلی روش پیشنهادی
نتیجه گیری
خلاصهسازی متن یکی از کارهای اساسی در بازیابی متون در اسناد است. یکی از راهکارهای اساسی در خلاصه سازی متن استفاده از تکنیکهای متنکاوی است. متن کاوی یکی از زیر شاخههای اساسی در دادهکاوی و یادگیری ماشین است. البته با توجه به حجم بالای دادهها در متن کاوی، این زمینه در زیرشاخه دادهکاوی قرار میگیرد. با توجه به اینکه متن یک داده بدون ساختار است.
باید با استفاده از ابزارهای مناسب، متن را تبدیل به یک مجموعه دادهای با ساختار مناسب کرد. از همین رو یکی از الزامات اولیه در متن کاوی پیش پردازش متن است. پس از پیش پردازش باید ویژگیهای مناسب متن استخراج گردد. ویژگیهای مورد استفاده در متن، همان کلماتی هستند که در متن وجود دارند.
بر اساس موارد گفته شده، در این پژوهش سعی شده است روشی برای خلاصه سازی متن بر اساس روشهای دادهکاوی و متنکاوی ارائه گردد. بر همین اساس در روش پیشنهادی پس از دریافت دادهها پیش پردازش مناسب روی متن صورت گرفت. در این مرحله از نشانهسازی بهره برده شد. پس از اینکه نشانهها در متن مشخص شدند، باید ویژگیهای مناسب از متن استخراج گردد.
برای استخراج ویژگی از متن، در این پایاننامه از روش کیسهی کلمات یا n-gram با حداکثر n=3 استفاده شده است. پس از اینکه ویژگیها استخراج شدند با روش TF-IDF ویژگیها وزندهی شدند. این دو مرحله، مرحله پردازش متن بودند. خروجی این دو مرحله یک مجموعه داده حجیم با تعداد زیادی ویژگی است. در گام بعدی به کمک MI و GWO ویژگیهای مناسب برای ساخت مدل طبقهبند KNN انتخاب شدند.
در نهایت مدل طبقه بندی KNN ساخته شد و معیارهای کارایی به دست آمده و مورد مقایسه قرار گرفتند.
درباره محصول
داکیومنت انتخاب ویژگی با الگوریتم گرگ خاکستری جهت افزایش دقت خلاصه سازی متن بر خط در 138 صفحه در قالب word و pdf بصورت زیپ شده قابل دانلود می باشد.
این محصول به صورت یک داکیومنت کامل است و توسط کارشناسان پی استور بازنگری و تایید شده می باشد. این محصول دارای نشان تضمین کیفیت پی استور می باشد. برای دانلود محصول آن ر ا خریداری فرمایید. به محض خرید محصول لینک دانلود در دسترس خواهد بود. در صورت بروز هرگونه مشکل با واحد فروش پی استور تماس حاصل فرمایید.
مباحث مرتبط در حیطه این موضوع
آموزش های مرتبط در حوزه این موضوع
تاریخ انتشار: | 13 خرداد 1399 |
---|---|
تاریخ بروزرسانی: | 25 اسفند 1399 |
حجم فایل: | 6.3 مگابایت |
فرمت فایل | docx با قابلیت ویرایش |
نسخه: | 1.0 |
هماهنگی با: | Microsoft Word 2007 و بالاتر |
تاکنون 348 نفر این محصول را تهیه کرده اند و 1 نظر برای آن ثبت شده است.
نظرات و دیدگاه ها
قوانین ثبت دیدگاه
- لطفاً دیدگاه های خود را فارسی تایپ کنید.
- دیدگاه های نامرتبط به مطلب تایید نخواهد شد.
- از درج دیدگاه های تکراری پرهیز نمایید.
- سوالات تخصصی خودتان را از طریق تیکت پشتیبانی مطرح کنید.
قیمت 189,000 تومان
تاریخ انتشار: | 13 خرداد 1399 |
---|---|
تاریخ بروزرسانی: | 25 اسفند 1399 |
حجم فایل: | 6.3 مگابایت |
فرمت فایل | docx با قابلیت ویرایش |
نسخه: | 1.0 |
هماهنگی با: | Microsoft Word 2007 و بالاتر |
1 بازخورد (مشاهده نظرات)
قیمت: 189,000 تومان
مدیریت و پشتیبانی
نظرات و پیشنهادات خود را با ما در میان بگذارید.