دسته بندی ، طبقه بندی ، کلاس بندی Classification
دسته بندی یا Classification چیست؟
دسته بندی یا Classification یک از شاخه های علوم داده یا Data Science می باشد. که در بحث پیش بینی آینده predicting the future با استفاده از تجزیه و تحلیل داده ها است. دسته بندی با نام های دیگری همچون طبقه بندی، کلاس بندی و Classification نیز شناخته می شود. طبقه بندی یک کار علمی داده ها برای پیش بینی مقدار متغیر طبقه بندی شده (هدف یا کلاس) با ساختن یک مدل بر اساس یک یا چند متغیر عددی و / یا دسته ای (پیش بینی کننده یا ویژگی) است.
طبقه بندی (classification)
همواره در زندگی ما، مواردی وجود دارند که دوست داریم بدانیم اگر یک کاری را انجام دهیم نتیجهی خوب یا بدی دارد؟ این کار رو چگونه انجام خواهیم داد؟ اگر بخواهیم بر اساس تجارب خودمان عمل کنیم نیاز داریم بر اساس کارهایی که قبلا انجام دادیم، و تجاربی که کسب کردیم ( یک فرآیند یادگیری رخ داده است)، برای شرایط جدید تصمیم گیری نماییم. این پارگراف بیان ساده ای از یادگیری ماشین را بیان میکند که تعریف دقیق و علمی آن به صورت زیر است:
طبقه بندی (classification) علمی است که بر اساس دادههای قبلی که دارای برچسب هستند، مدلی برای پیش بینی برچسب دادههای جدید میسازد.
طبقه بندی classification یکی از زیر شاخه های اساسی یادگیری ماشین و داده کاوی است. و اساس آن دادههای جمعآوری شده از اعمال گذشته هستند. اعمالی که بر اساس دانش فرد خبره برچسب گذاری شدند. برای اینکه یک مدل طبقه بند خوب داشته باشیم، باید با دادهها و ساختار آنها و نیز تعداد دستهها (برچسب-کلاس-طبقه) اطلاع داشته باشیم. هر چند آشنایی با ساختار و نوع دادهها گاها عملی غیر ممکن است اما در صورت وجود یک آشنایی ساده گاها نیز میتوان مدل طبقه بند درست را انتخاب کرد.
برای درک مفهوم طبقه بندی classification یک بار دیگر پارگراف اول را بخوانید. به بیان دیگر؛ طبقه بندی classification فرآیند قرار داده نمونههای جدید در طبقات مختلف بر اساس دادههای قدیمی است و برای اینکار به یک مدل طبقهبند یا الگوریتم طبقهبند نیاز است.
گروه های اصلی الگوریتم های دسته بندی
چهار گروه اصلی الگوریتم های طبقه بندی عبارتند از:
1- جدول فراوانی Frequency Table
2- ماتریس کواریانس Covariance Matrix
- Linear Discriminant Analysis
- Logistic Regression
3- توابع تشابه Similarity Functions
4- سایر موارد
درباره امین جلیل زاده رزین
پایه گذار و موسس وب سایت آموزشی پی استور، مدرس دانشگاه فنی و حرفه ای، برنامه نویس و تحلیل گر سیستم، پژوهشگر در حوزه الگوریتم های ابتکاری، فرا ابتکاری، یادگیری ماشین، شبکه و پایگاه داده. ایشان در زبان های برنامه نویسی متعدد، نظیر ++C، سی شارپ، PHP ،Java، متلب MATLAB و Python تسلط و سابقه تدریس فعال دارند.
سپاس از توضیحات مفید و خوبتان
[…] اصلی که بین خوشهبندی Clustering و طبقهبندی Classification وجود دارد، نداشتن برچسبهای اولیه برای مشاهدات است. […]
[…] درخت تصمیم یا الگوریتم ID3 یکی از روش های دسته بندی یا classification در زیر شاخه گروه جدول فراوانی Frequency Table در بحث پیش بینی […]
[…] بندی درخت تصمیم یکی از روش های دسته بندی یا classification در زیر شاخه گروه جدول فراوانی Frequency Table در بحث پیش بینی […]
[…] بندی OneR یکی از روش های دسته بندی یا classification در زیر شاخه گروه جدول فراوانی Frequency Table در بحث پیش بینی […]
[…] بندی ZeroR یکی از روش های دسته بندی یا classification در زیر شاخه گروه جدول فراوانی Frequency Table در بحث پیش بینی […]