دسته بندی ZeroR چیست؟
دسته بندی ZeroR یکی از روش های دسته بندی یا classification [2] در زیر شاخه گروه جدول فراوانی Frequency Table در بحث پیش بینی آینده predicting the future [3] در علوم داده [4] یا داده کاوی است. روش ZeroR ساده ترین روش طبقه بندی است که به هدف متکی است و همه پیش بینی کننده ها را نادیده می گیرد. طبقه بندی ZeroR به راحتی طبقه بندی اکثریت (کلاس) را پیش بینی می کند. اگرچه هیچ قدرت پیش بینی در ZeroR وجود ندارد ، اما برای تعیین عملکرد پایه به عنوان معیار سایر روش های طبقه بندی مفید است.
الگوریتم ZeroR
یک جدول فرکانس یا جدول فراوانی برای هدف ایجاد کنید و بیشترین مقدار آن را انتخاب کنید.
مثال دسته بندی ZeroR
مثال زیر در نظر بگیرید در این مثال شرایط آب و هوایی لازم برای برگزاری بازی گلف در نظر گرفته شده است. 4 ستون با نام های Outlook (چشم انداز)، temp (دما)، Humidity ( رطوبت) و windy (باد) در نظر گرفته شده است. ستون پنجم ستون هدف یا بازی گلف Play Golf است. با استفاده از 4 ستون قبلی و در نظر گرفتن شرایط آنها باید در نظر گرفت بازی گلف انجام می شود یا نه. در ابتدا فراوانی بازی انجام Yes و بازی غیر انجام No بدست می آوریم. (مانند شکل زیر)
فراوانی No برای بازی گلف 5 و Yes برابر با 9 است.
پیش بینی مشارکت Predictors Contribution
در مورد سهم پیش بینی کننده های مدل چیزی گفته نشده است زیرا ZeroR از هیچ یک از آنها استفاده نمی کند.
ارزیابی مدل
ماتریس اغتشاش زیر نشان می دهد که ZeroR فقط کلاس اکثریت را به درستی پیش بینی می کند. همانطور که قبلاً ذکر شد ، ZeroR فقط برای تعیین عملکرد پایه برای سایر روشهای طبقه بندی مفید است.
“Play Golf = Yes” مدل ZeroR برای مجموعه داده زیر با دقت 0.64 است یعنی تعداد Yes ها بر کل فراوانی (Yes/Yes+NO) یعنی 5+9/9=0.64