داده کاوی
پاورپوینت کتابخانه های داده کاوی در پایتون
در این بخش پاورپوینت کتابخانه های داده کاوی در پایتون قرار داده شده است. زبان برنامه نویسی پایتون دارای کتابخانههای متعدد داده کاوی میباشد که مورد استفاده بسیاری از برنامه نویسان قرار میگیرد. پاورپوینت کتابخانه های داده کاوی در پایتون به معرفی این کتابخانه ها میپردازد. این پاورپوینت آماده در 24 اسلاید در قالب ppt. یا pptx. با قابلیت ویرایش برای ارائه درسی آماده دانلود میباشد.
تبدیل دیتاست NSL-KDD برای استفاده الگوریتم های یادگیری ماشین در متلب
دیتاست NSL-KDD در سال 2009 بعنوان نسخه جدید تجدید نظر شده در مجموعه داده اصلی KDDCup99 ارائه شد که با حجم کم ویژگی های سودمند و چالش برانگیز KDDCup را حفظ کرد. امروزه این دیتاست به عنوان یک مجموعه داده ارزشمند برای بررسی کارایی روش ها و الگوریتم های امنیت سایبری و سیستم های تشخیص نفوذ بکار گرفته می شود.
انتخاب ویژگی با الگوریتم گرگ خاکستری جهت افزایش دقت خلاصه سازی متن بر خط
انتخاب ویژگی معمولاً برای کاهش ابعاد مجموعه داده و افزایش دقت در الگوریتم های یادگیری ماشین استفاده می شود. در این پایانامه انتخاب ویژگی با الگوریتم گرگ خاکستری برای کاهش ابعاد و همچنین افزایش دقت در متن کاوی با الگوریتم یادگیری ماشین KNN و همچنین روش اطلاعات متقابل MUTUAL INFORMATION در نظر گرفته شده است.
استخراج ویژگی از متن با روش اطلاعات متقابل Mutual Information
استخراج ویژگی با روش اطلاعات متقابل Mutual Information یا MI یکی از روشهای فیلتری برای استخراج ویژگی از متن است. روش اطلاعات متقابل بین دو متغیر معیاری برای نشان دادن میزان وابستگی متقابل آن دو متغیر نسبت به هم میباشد. مفهوم اطلاعات متقابل ذاتاً مرتبط با آنتروپی یک متغیر (که میزان اطلاعات موجود در یک متغیر دیگر را نشان میدهد) میباشد. در این آموزش اطلاعات کاملی از نحوه عملکرد متد اطلاعات متقابل برای متن کاوی به همراه مثال ارائه شده است.
سمینار روش های پیش بینی و تخمین نقص نرم افزار با استفاده از داده کاوی
با توسعه فنآوری کامپیوتر، سیستم های نرمافزاری بیشتر و پیچیدهتر میشود. به علت محدودیت توانایی انسان، نقایص زیادی در چرخه حیات توسعه نرمافزاری وجود دارد. کیفیت یکی از مسائل مهم در فرآیند تولید و توسعه نرمافزار است. جهت افزایش کیفیت، نقصهای نرمافزار باید قبل از انتشار تشخیص داده شود. پیشبینی و تشخیص نقصها در مراحل اولیه توسعه نرمافزار سبب افزایش کیفیت محصول تولیدی نرمافزار میشود یکی از مؤثرترین پیشبینیهای نقص نرمافزار استفاده از تکنیکهای دادهکاوی و الگوریتمهای یادگیری ماشین است. در این روشها مؤلفههای نرمافزاری در دو دسته مستعد نقص و غیر مستعد نقص قرار میگیرند.
پاورپوینت انواع خوشه بندی در داده کاوی ( داده های جریانی )
مدل جریان داده اخیرا به دلیل کاربردهای فراوانش در انواع متعددی از داده ها ، از جمله رکورد های تلفنی ، اسناد تحت وب و جریان کلیک ها و ….. ، توجهات را به سمت خودش جلب کرده است. جریان داده یک دنباله مرتب از نقاط X1,X2,X3……….…….,Xn می باشد که باید به صورت مرتب هر بار مورد دسترسی قرارگیرد و همچنین می تواند یک دفعه یا تعداد کمی از دفعات خوانده شود.
پیشبینی موفقیت در بانکداری تلفنی با الگوریتمهای یادگیری ماشین
در این پست داکیومنت پیشبینی موفقیت در بانکداری تلفنی با الگوریتمهای یادگیری ماشین قرار داده شده است. ضرورت سرعت عمل در بازاریابی بر کسی پوشیده نیست. با پیشرفت جوامع و ایجاد کسبوکارهای دیجیتال، سیستمهای قدیمی توانایی قابلتوجهی برای جذب سرمایه و مشتری ندارند. یادگیری ماشین و سایر فناوریهای پیشرفته، فرصتهای جدیدی برای هزینه هوشمندانه بودجههای بازاریابی فراهم کرده است.
تأثیر تمرینات پیلاتس بر آمادگی جسمانی افراد کمتوان ذهنی
برای شبیهسازی تأثیرات تمرینات پیلاتس بر روی افراد کمتوان ذهنی نیاز به مجموعه داده میباشد که متأسفانه چنین مجموعه دادهای برای این افراد تاکنون گردآوری نشده است. با جمعآوری مجموعه داده برای افراد کمتوان ذهنی و اعمال شبیهسازی و بررسی تحقیق روی این مجموعه میتوان علاوه بر اثر سلامت جسمی افراد کمتوان ذهنی بر روی رو سلامت روان این افراد با دادن اعتمادبهنفس تأثیر گذاشت.
تبدیل دیتاست KDD99 برای استفاده الگوریتم های یادگیری ماشین در متلب
یکی از مشکلات محققان در زمینه دیتاست ها چگونگی جستجو و تهیه آن است ولی مشکل اصلی پس از پیدا کردن دیتاست، نحوه استفاده و تزریق آن به الگوریتم ها است. بدین صورت که اکثر دیتاست ها یا مجموعه داه ها بصورت خام هستند و برای استفاده از آن ها بایستی پیش پردازش شوند. احتمالا در موارد بسیار زیادی داده ها در دیتاست ها دارای نوع متفاوتی باشند (رشته، عدد) که نحوه تبدیل آنها به فرمت مخصوص الگوریتم ها با ابعا گسترده دیتاست ها کاری طاقت فرسا است. مخصوصا اینکه برای مشاهده نتیجه پس از اجرای کد بایستی چندین ساعت منتظر ماند.
بررسی اثر سه کلاسه کردن دستهبندی بر روی دقت تشخیص اسپم در ایمیل های فارسی – تشخیص اسپم در ایمیل
تشخیص اسپم در ایمیل های فارسی عنوان داکیومنتی است که در این پست به آن پرداخته شده است. در یک دهه گذشته، با گسترش سریع اینترنت ایمیلها یکی از سریعترین و مقرون به صرفهترین و راحتترین راههای ارتباطی شدهاند. امروزه ایمیلها در اینترنت به صورت نمایی در حال افزایش میباشند، اما متاسفانه کارایی و ماهیت اقتصادی ایمیلها مورد سوءاستفاده قرار گرفته است.
روشهای تشخیص اسپم و فیلترینگ آن
از سالهای اخیر، ایمیلها به عنوان ابزاری برای ارتباطات سریع و غیرهمزمان مورد استفاده میباشند که رشد سریع ایمیلها و هزینهی کم آنها باعث شده تا برخی افراد از آنها سوءاستفاده کنند و شروع به ارسال ایمیلهای بیهوده تحت عنوان اسپم کنند. امروزه ایمیلهای اسپم یک مسئله در حال افزایش میباشد که باعث یک اثر اقتصادی در جامعه شده است.
چالش های محاسبات داده های بزرگ در سلامت
در این بخش یک تحقیق کلاسی در زمینه کلان داده در پزشکی قرار داده شده است. این تحقیق را میتوان در زمینه محاسبات داده های بزرگ در سلامت یا همان big data در سلامت استفاده کرد. این تحقیق بیشتر در مورد چالش های محاسبات کلان داده در سلامت انجام شده است که در قالب ورد Word در 28 صفحه قابل دانلود می باشد.