شبیه سازی تشخیص سرطان سینه با استفاده از الگوریتم ماشین بردار پشتیبان SVM در متلب

شبیه سازی تشخیص سرطان سینه عنوان پروژه ای است که در این پست قرار داده ایم. شبیه سازی تشخیص سرطان سینه با استفاده از الگوریتم ماشین بردار پشتیبان SVM در شبیه ساز  محبوب متلب 2014 پیاده سازی شده است. این پروژه به دنبال تشخیص نوع سرطان سینه بدخیم و خوش خیم می پردازد و با استفاده از معیارهای دقت، صحت، F1 و Recall پیاده سازی ارزیابی می شود. در ادامه به تشریح روش پیاده سازی خواهیم پرداخت.

دیتاست DataSet

دیتاست مورداستفاده مجموعه داده بیماران سرطان سینه موجود در مخزن داده‌ی یادگیری ماشین دانشگاه ارواین، ایالت کالیفرنیا آمریکا (University of California at Irvine) است و در آدرس آنلاین آن موجود می‌باشد. و شامل ریسک فاکتورهای ضخامت انبوه، یکنواختی اندازه سلول، یکنواختی شکل سلول، چسبندگی لبه‌ها، حجم سلول بافت اپیتلیال، هسته‌های عریان، کروماتین بلاند، هسته عادی و تقسیم هسته سلول به دو قسمت می‌باشد که در ایالت ویسکانسین ایالات‌متحده جمع‌آوری‌شده است.

شبیه سازی تشخیص سرطان سینه یا سرطان پستان SVM

 

9 ویژگی در این ساختار مشخص است و سطر آخر نیز نمایان گر نوع کلاس است که به‌صورت خوش‌خیم (2) و بدخیم (4) مشخص‌شده است و مشخصات تعداد 699 نمونه از افراد مبتلا به سرطان در این مجموعه داده در سال 1992 جمع‌آوری‌شده است. داده‌های موجود در این مجموعه به سه دلیل بایستی پیش‌پردازش شوند.

در این مجموعه داده، مقدار بعضی داده‌ها وارد نشده بود که به‌اصطلاح داده‌های گم‌شده بودند، هدف از این پیش‌پردازش این بود که داده‌های گم‌شده حذف شوند که در روند شبیه‌سازی خطا را کم کنند. سطرهایی که شامل داده‌های گمشده بودند حذف شدند که پس‌ازاین مرحله 683 سطر باقی ماند. ازآنجاکه شماره شناسایی بیماران جزء فاکتورهای تشخیصی نوع سرطان پستان نبود در پیش پردازش داده ها حذف شدند.

شبیه سازی

شبیه سازی تشخیص سرطان سینه با استفاده از الگوریتم ماشین بردار پشتیبان در متلب 2014 آماده شده است. که دارای 4 فایل .m می باشد.

• فایل main.m :
این فایل تابع اصلی شبیه سازی می باشد که اجرای برنامه از آن شروع می شود. دیتاست پیش پردازش شده در متغیر IOdata ذخیره شده است 70 درصد از داده ها به صورت تصادفی به آموزش داده می شود و 30 درصد برای تست. معیارهای ارزیابی و نمودارها در این تابع فراخوانی می شوند.
• فایل IOdata.mat
این فایل همان دیتاست سرطان سینه می باشد که پیش پردازه شده و دارای 9 ویژگی می باشد.
• فایل confusionmatStats.m
معیارهای ارزیابی و آماری که فرمول های آنها در ادامه معرفی می شود در این قسمت پیاده سازی شده و از تابع اصلی صدا زده می شوند.
فایل roc_curve.m
این فایل مربوط به رسم نمودار ROC می باشد که نسبت حساسیت به ویژگی را نشان می دهد.

 

خروجی شبیه سازی

به‌طورکلی برای برسی میزان موفقیت و کارایی سیستم های دسته‌بندی و تشخیص بیماری‌ها از ماتریس درهم ریختگی استفاده می‌شود. تحلیل ماتریس در هم ریختگی در دسته‌بندی و تشخیص بیماری‌ها منجر به 4 حالت TP, TN, FP, FN می‌شود از نتایج ماتریس در هم ریختگی سه شاخص دقت, صحت و کارایی به دست میاید که برای تحلیل عملکرد سیستم‌های طبقه‌بندی استفاده می‌شود.

نمودار اول مربوط به تشخیص دسته بیماری می باشد نقاط آبی مقدار واقعی کلاس و نقاط قرمز تشخیص ماشین بردار پشتیبان از دیتا ست شبیه سازی تشخیص سرطان سینه می باشد.

 

شبیه سازی تشخیص سرطان سینه SVM

برای ارزیابی از چهار معیار دقت، صحت، F1 و Recall استفاده شده است که با استفاده از فرمول های این معیار ها و ماتریس کانفیوژن که  منجر به 4 حالت TP, TN, FP, FN می‌شود استفاده شده است شکل زیر عملکرد شبیه سازی تشخیص سرطان سینه با استفاده از الگوریتم ماشین بردار پشتیبان SVM  را نشان می دهد.

شبیه سازی تشخیص سرطان سینه SVM ماشین بردار پشتیبان

 

برای انواع خطاها در الگوریتم‌های یادگیری از معیارهای دیگری که در ادامه مطرح شده است استفاده می شود:

  • آمار کاپا (Kappa Statistic): یک معیار شانس درست است که برای تمییز کلاس‌بندی از کلاس‌های درست استفاده می‌شود.
  • میانگین خطای مطلق (MAE): خطای پیش‌بینی نزدیک به نتایج احتمالی را نشان می‌دهد.
  • ریشه میانگین مربعات خطا (RMSE): مربعات ریشه‌ی واریانس است و به عنوان خطای استاندارد شناخته می‌شود و مربعات خطای آموزشی را نشان می‌دهد.
  • خطای نسبی مطلق (RAE): عبارت است از نسبت خطای مطلق به اندازه حقیقی.
  • ریشه نسبی مربعات خطا (RRSE): مربعات خطای آموزشی نسبی را نشان می‌دهد.

شکل زیر مقادیر انواع خطاها در الگوریتم‌های یادگیری را نشان می دهد.

تشخیص سرطان سینه با SVM

 

نمودار زیر ROC نسبت حساسیت و ویژگی تشخیص بیماری را نشان می دهد.

تشخیص سرطان سینه با ماشین بردار پشتیبان ROC

معرفی ویدئوی محصول

 

شبیه سازی تشخیص سرطان سینه با استفاده از الگوریتم ماشین بردار پشتیبان SVM در متلب 2014b توسط کارشناسان پی استور تست و اجرا شده است و دارای نشان تضمین کیفیت پی استور می باشد. این محصول دارای 4 فایل متلب به همراه توضیح فارسی در قالب word که شامل فرمول ها و متغیرهای شبیه سازی است بصورت zip شده قابل دانلود است. به محض خرید محصول با قیمت استثنایی لینک دانلود در دسترس خواهد بود.

45,000 تومان

1 دیدگاه برای شبیه سازی تشخیص سرطان سینه با استفاده از الگوریتم ماشین بردار پشتیبان SVM در متلب

  1. امتیاز 5 از 5

    programstore

    نظرات و دیدگاه های خود را با ما درمیان بگذارید.

دیدگاه خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.

اطلاعات فروشنده