دسته بندی ، طبقه بندی ، کلاس بندی Classification
دسته بندی یا Classification چیست؟
دسته بندی یا Classification یک از شاخه های علوم داده یا Data Science می باشد. که در بحث پیش بینی آینده predicting the future با استفاده از تجزیه و تحلیل داده ها است. دسته بندی با نام های دیگری همچون طبقه بندی، کلاس بندی و Classification نیز شناخته می شود. طبقه بندی یک کار علمی داده ها برای پیش بینی مقدار متغیر طبقه بندی شده (هدف یا کلاس) با ساختن یک مدل بر اساس یک یا چند متغیر عددی و / یا دسته ای (پیش بینی کننده یا ویژگی) است.
طبقه بندی (classification)
همواره در زندگی ما، مواردی وجود دارند که دوست داریم بدانیم اگر یک کاری را انجام دهیم نتیجهی خوب یا بدی دارد؟ این کار رو چگونه انجام خواهیم داد؟ اگر بخواهیم بر اساس تجارب خودمان عمل کنیم نیاز داریم بر اساس کارهایی که قبلا انجام دادیم، و تجاربی که کسب کردیم ( یک فرآیند یادگیری رخ داده است)، برای شرایط جدید تصمیم گیری نماییم. این پارگراف بیان ساده ای از یادگیری ماشین را بیان میکند که تعریف دقیق و علمی آن به صورت زیر است:
طبقه بندی (classification) علمی است که بر اساس دادههای قبلی که دارای برچسب هستند، مدلی برای پیش بینی برچسب دادههای جدید میسازد.
طبقه بندی classification یکی از زیر شاخه های اساسی یادگیری ماشین و داده کاوی است. و اساس آن دادههای جمعآوری شده از اعمال گذشته هستند. اعمالی که بر اساس دانش فرد خبره برچسب گذاری شدند. برای اینکه یک مدل طبقه بند خوب داشته باشیم، باید با دادهها و ساختار آنها و نیز تعداد دستهها (برچسب-کلاس-طبقه) اطلاع داشته باشیم. هر چند آشنایی با ساختار و نوع دادهها گاها عملی غیر ممکن است اما در صورت وجود یک آشنایی ساده گاها نیز میتوان مدل طبقه بند درست را انتخاب کرد.
برای درک مفهوم طبقه بندی classification یک بار دیگر پارگراف اول را بخوانید. به بیان دیگر؛ طبقه بندی classification فرآیند قرار داده نمونههای جدید در طبقات مختلف بر اساس دادههای قدیمی است و برای اینکار به یک مدل طبقهبند یا الگوریتم طبقهبند نیاز است.
گروه های اصلی الگوریتم های دسته بندی
چهار گروه اصلی الگوریتم های طبقه بندی عبارتند از:
1- جدول فراوانی Frequency Table
2- ماتریس کواریانس Covariance Matrix
- Linear Discriminant Analysis
- Logistic Regression
3- توابع تشابه Similarity Functions
4- سایر موارد
درباره امین جلیل زاده رزین
کارشناس ارشد رشته مهندسی کامپیوتر گرایش نرم افزار - پایه گذار و موسس وب سایت آموزشی پی استور، مدرس دانشگاه فنی و حرفه ای، برنامه نویس و تحلیل گر سیستم، پژوهشگر در حوزه الگوریتم های ابتکاری، فرا ابتکاری، یادگیری ماشین، شبکه و پایگاه داده. ایشان در زبان های برنامه نویسی متعدد، نظیر ++C، سی شارپ، PHP ،Java، متلب MATLAB و Python تسلط و سابقه تدریس فعال دارند.
میزان رضایتمندی
مطالب زیر را حتما مطالعه کنید
آموزش یادگیری عمیق — از مفاهیم تا اصول پایه Deep Learning
آموزش یادگیری عمیق با پایتون — آشنایی با Deep Learning و شبکه های عصبی
آموزش انتخاب ویژگی با الگوریتم ژنتیک در پایتون – جامع و کاربردی
NLP چیست؟ آموزش NLP بصورت جامع و کامل
روش های انتخاب ویژگی در داده کاوی – نحوه انتخاب ویژگی و موارد استفاده از آن
آموزش پایتون پیشرفته – راهنمایی عملی خوشه بندی K-Means در پایتون به صورت گام به گام
6 دیدگاه
به گفتگوی ما بپیوندید و دیدگاه خود را با ما در میان بگذارید.
سپاس از توضیحات مفید و خوبتان