این شاخه به این معنا است که ماشین بتواند برنامه، ساختار یا دادههایش را بر اساس ورودیها یا در پاسخ به اطلاعات خارجی، به نحوی تغییر دهد که رفتارش به آن چه از او انتظار میرود نزدیکتر شود، به عبارت دیگر میتوان گفت یعنی قدرت تجزیه تحلیل داشته باشد.
وظیفهی اساسی برای داده کاوی
اگر متنهای قدیمی و کلاسیک داده کاوی را مطالعه کرده باشید، در آن چهار وظیفهی اساسی برای داده کاوی برشمرده شده است.
- دسته بندی (Classification)
- خوشه بندی (Clustering)
- تحلیل قواعد انجمنی (Association Rules)
- مصور سازی (Visualization)
در تقسیم بندی دیگر، تمام الگوریتمهای داده کاوی و یادگیری ماشین به سه دسته کلی:
- یادگیری با ناظر (Supervised Learning)
- یادگیری بدون ناظر (Unsupervised Learning)
- یادگیری نیمه ناظر (Semi-Supervised Learning)
تقسیم بندی یادگیری ماشین
هر کدام از این تقسیم بندیها الگوریتمها و دنیای خودش را دارد ولی به طور کلی، یادگیری با ناظر با استفاده از برچسب یا label دادهها، برچسب دادههای مشاهده نشده را تشخیص میدهد ولی در یادگیری بدون ناظر معمولا برچسب دادهها موجود نیست.
یادگیری نیمه ناظر هم چیزی بین این دوتاست که معمولا حالت استاد-شاگردی در آن شبیه سازی میشود و استاد تنها در بعضی مواقع خاص تقلبهایی به شاگردش که الگوریتم باشد، میرساند. هر کدام از این سه حالت کلی، دنیای خاص خودشان را دارند. به طور مثال خود یادگیری با ناظر در یک دسته بندی به زیربخشهای زیر میتواند تفکیک شود.
یادگیری با ناظر
- یادگیری تنبل (Lazy Learning): که با استفاده از ذخیره سازی دادهها، دسته بندی را انجام میدهند. مثال بارزش الگوریتم نزدیکترین همسایگی (KNN) است.
- یادگیری احتمالی (Probabilistic Learning): با استفاده از تکنیکها و روشهای آماری نظیر تئوری بیزین، کار دسته بندی را انجام میدهند.
- یادگیری تقسیم و غلبه (Divide and Conquer Learning): با استفاده از استراتژی معروف انگلیس در سالهای دور و شاید الان، یعنی تقسیم و غلبه، دسته بندی صورت میگیرد. مثال معروفش درخت تصمیم است.
- پیش بینی مقدار عددی (Regression Methods): در اینجا برچسب خود مقدار متغیر پاسخ است که با استفاده از الگوریتمهای مختلف، پیش بینی میشود. مثال معروفش همان رگرسیون خطی است.
- روشهای جعبه سیاهی (Black-box Methods): که نحوهی عملکرد دقیق در میانههای راه اجرای الگوریتمها قابل تفکیک نیست که عمدتا ناشی از پیچیدگی ذات متغیرها و تعداد زیاد آنهاست. اصلیترین روش شبکه عصبی و خانوادهی پرجمعیت آن است.
- خوشه بندی افرازی (Partitioning Methods)
- خوشه بندی سلسه مراتبی (Hierarchical Methods)
- خوشه بندی چگالی محور (Density-Based Methods)
- خوشه بندی شبکهای (Grid-Based Methods)
کاربردهای یادگیری ماشین
تاکنون کاربردهای بسیار زیادی از هوش مصنوعی و یادگیری ماشین را در زندگی روزمره تجربه کردهایم. سرویسهای ایمیل برای تشخیص اسپم از الگوریتمهای یادگیری ماشین استفاده میکنند. سیستمهای پیشنهادگر، مرتبسازی نتایج موتورهای جستجو، تشخیص چهره خندان برای عکاسی خودکار، همگی نمونههای دیگری از کاربردهای یادگیری ماشین هستند.
6 پاسخ
نظرات و دیدگاه های خود را برای هرچه بهتر قرار دادن مطالب با ما در میان بگذارید.