دسته بندی ZeroR چیست؟
دسته بندی ZeroR یکی از روشهای دسته بندی یا classification در زیر شاخه گروه جدول فراوانی Frequency Table در بحث پیش بینی آینده predicting the future در علوم داده یا داده کاوی است. روش ZeroR سادهترین روش طبقه بندی است که به هدف متکی است و همه پیش بینی کنندهها را نادیده میگیرد.
الگوریتم ZeroR
یک جدول فرکانس یا جدول فراوانی برای هدف ایجاد کنید و بیشترین مقدار آن را انتخاب کنید.
مثال دسته بندی ZeroR
مثال زیر در نظر بگیرید در این مثال شرایط آب و هوایی لازم برای برگزاری بازی گلف در نظر گرفته شده است. ۴ ستون با نامهای Outlook (چشم انداز)، temp (دما)، Humidity ( رطوبت) و windy (باد) در نظر گرفته شده است. ستون پنجم ستون هدف یا بازی گلف Play Golf است. با استفاده از ۴ ستون قبلی و در نظر گرفتن شرایط آنها باید در نظر گرفت بازی گلف انجام میشود یا نه. در ابتدا فراوانی بازی انجام Yes و بازی غیر انجام No بدست میآوریم. (مانند شکل زیر)
فراوانی No برای بازی گلف ۵ و Yes برابر با ۹ است.
پیش بینی مشارکت Predictors Contribution
در مورد سهم پیش بینی کنندههای مدل چیزی گفته نشده است زیرا ZeroR از هیچ یک از آنها استفاده نمی کند.
ارزیابی مدل
ماتریس اغتشاش زیر نشان میدهد که ZeroR فقط کلاس اکثریت را به درستی پیش بینی میکند. همانطور که قبلاً ذکر شد، ZeroR فقط برای تعیین عملکرد پایه برای سایر روشهای طبقه بندی مفید است.
“Play Golf = Yes” مدل ZeroR برای مجموعه داده زیر با دقت ۰.۶۴ است یعنی تعداد Yesها بر کل فراوانی (Yes/Yes+NO) یعنی ۵+۹/۹=۰.۶۴