دسته بندی یا Classification چیست؟
دسته بندی یا Classification یک از شاخههای علوم داده یا Data Science میباشد. که در بحث پیش بینی آینده predicting the future با استفاده از تجزیه و تحلیل دادهها است. دسته بندی با نامهای دیگری همچون طبقه بندی، کلاس بندی و Classification نیز شناخته میشود.
طبقه بندی (classification)
همواره در زندگی ما، مواردی وجود دارند که دوست داریم بدانیم اگر یک کاری را انجام دهیم نتیجهی خوب یا بدی دارد؟ این کار رو چگونه انجام خواهیم داد؟ اگر بخواهیم بر اساس تجارب خودمان عمل کنیم نیاز داریم بر اساس کارهایی که قبلا انجام دادیم و تجاربی که کسب کردیم ( یک فرآیند یادگیری رخ داده است)، برای شرایط جدید تصمیم گیری نماییم. این پارگراف بیان سادهای از یادگیری ماشین را بیان میکند که تعریف دقیق و علمی آن به صورت زیر است:
طبقه بندی (classification) علمی است که بر اساس دادههای قبلی که دارای برچسب هستند، مدلی برای پیش بینی برچسب دادههای جدید میسازد.
طبقه بندی classification یکی از زیر شاخههای اساسی یادگیری ماشین و داده کاوی است و اساس آن دادههای جمعآوری شده از اعمال گذشته هستند. اعمالی که بر اساس دانش فرد خبره برچسب گذاری شدند.
برای اینکه یک مدل طبقه بند خوب داشته باشیم، باید با دادهها و ساختار آنها و نیز تعداد دستهها (برچسب-کلاس-طبقه) اطلاع داشته باشیم. هر چند آشنایی با ساختار و نوع دادهها گاها عملی غیر ممکن است اما در صورت وجود یک آشنایی ساده گاها نیز میتوان مدل طبقه بند درست را انتخاب کرد.
برای درک مفهوم طبقه بندی classification یک بار دیگر پارگراف اول را بخوانید. به بیان دیگر؛ طبقه بندی classification فرآیند قرار داده نمونههای جدید در طبقات مختلف بر اساس دادههای قدیمی است و برای اینکار به یک مدل طبقهبند یا الگوریتم طبقهبند نیاز است.
گروه های اصلی الگوریتمهای دسته بندی
چهار گروه اصلی الگوریتمهای طبقه بندی عبارتند از:
۱- جدول فراوانی Frequency Table
۲- ماتریس کواریانس Covariance Matrix
- Linear Discriminant Analysis
- Logistic Regression
۳- توابع تشابه Similarity Functions
۴- سایر موارد
6 پاسخ
سپاس از توضیحات مفید و خوبتان