الگوریتم درخت تصمیم Decision Tree

الگوریتم درخت تصمیم
الگوریتم درخت تصمیم Decision Tree   الگوریتم درخت تصمیم یا الگوریتم ID3 یکی از روش های دسته بندی یا classification در زیر شاخه گروه جدول فراوانی Frequency Table در بحث پیش بینی آینده predicting the future در علوم داده یا داده کاوی است. در ادامه به توضیح و تشریح این الگوریتم همراه با یک مثال خواهیم پرداخت.الگوریتم درخت تصمیم چیست؟ الگوریتم درخت تصمیم مدل های طبقه بندی یا رگرسیون را به شکل ساختار درخت می سازد. درخت تصمیم ، مجموعه داده را به زیر مجموعه های کوچکتر و کوچکتر تجزیه می کند و یک درخت تصمیم...
ادامه مطلب

الگوریتم های یادگیری ماشین

یادگیری ماشین
الگوریتم های یادگیری ماشین يادگيري ماشين، يكي از مهم ترين بخش هاي هوش مصنوعي است. براي هوشمند بودن، يك سيستم كه در محيطي با شرايط متغير قرار دارد، بايد توانايي آموختن داشته باشد. در چنين حالتي طراحان نيازي به پيش بيني حالات ممكن نخواهند داشت.هوش انسانی قدرت درک و ايجاد ارتباط ميان موضوع‌ها و مقایسه آنها را دارد. انسان همواره قانون‌های جدیدی را می‌سازد و يا قوانین قبلی را در موارد جدید بکار می‌گیرد. توانايی انسان در ايجاد مفهوم‌های گوناگون در دنيای پيرامون خود، از...
ادامه مطلب

مفهوم خوشه بندی یا Clustering

مفهوم خوشه بندی
مفهوم خوشه بندی یا Clustering در این پست در مورد مفهوم خوشه بندی یا Clustering ، انواع روش های خوشه بندی داده ها ، کاربرد خوشه بندی ، معیارهای ارزیابی کیفیت خوشه بندی همراه با مثال خوشه بندی و در کل اینکه خوشه بندی چیست؟ و چه تفاوت هایی با طبقه بندی یا دسته بندی دارد به طور مفصل صحبت خواهیم کرد و آنها را توضیح و تشریح خواهیم کرد.تعریف خوشه بندی برای اینکه مفهوم خوشه بندی یا Clustering را بدانیم ابتدا لازم است تعریفی از خوشه بندی ارائه شود. در تعریف خوشه بندی می توان گفت: خوشه بندی،...
ادامه مطلب

k همسایه نزدیک

الگوریتم k نزدیک ترین همسایه
روش k همسایه‌ نزدیک روش k همسایه‌ نزدیک K Nearest Neighbors یا (KNN) یک روش یادگیری موردی ‌است و از جمله ساده‌ترین الگوریتم‌های یادگیری ماشین می‌باشد که به روش K نزدیک ترین همسایه نیز معروف است. در این الگوریتم یک نمونه با رای اکثریت از همسایه‌هایش دسته‌بندی می‌شود و این نمونه در عمومی‌ترین کلاس مابین k همسایه نزدیک تعیین می‌شود. K یک مقدار مثبت صحیح و عموماً کوچک است. اگر k=1 باشد نمونه به سادگی در کلاس همسایگان نزدیکش تعیین می‌گردد. فرد بودن مقدار k مفید می‌باشد چون با این کار...
ادامه مطلب

الگوریتم نیو بیزین naive bayesian

الگوریتم نیوبیزین
روش نیو بیزین تئوری بیزین توسط توماس بیز در سال (1702-1761) پیشنهاد شد. قضیه بیزین یک روش از محاسبات احتمالی است و احتمال رخدادی که در آینده رخ خواهد داد وابسته به رخدادی است که قبلا رخ داده است. این تئوری توانایی خود یادگیری در سیستم هوشمند دارد که به‌صورت گسترده استفاده می‌شود. از تئوری بیزین می‌توان برای پیش‌بینی حوادث آینده بر اساس حوادث حاضر طبق نظریه‌ی آمار و احتمال استفاده کرد. دسته بندی نیو بیزین بر پایه قضیه Bayes و فرضیه های استقلال بین پیش بینی کننده ها است. یک مدل...
ادامه مطلب

الگوریتم های یادگیری ماشین

یادگیری ماشین
یادگیری ماشین [caption id="attachment_4071" align="aligncenter" width="700"] یادگیری ماشین[/caption]به عنوان یکی از شاخه‌های وسیع و پرکاربرد هوش مصنوعی، یادگیری ماشین (Machine learning) به تنظیم و اکتشاف شیوه‌ها و الگوریتم‌هایی می‌پردازد که بر اساس آنها رایانه‌ها و سامانه‌ها توانایی تعلم و یادگیری پیدا می‌کنند.این شاخه به این معنا است که ماشین بتواند برنامه، ساختار یا داده‌‏هایش را بر اساس ورودی‏‌ها یا در پاسخ به اطلاعات خارجی، به نحوی تغییر دهد که رفتارش به آن چه از او انتظار می‌‏رود نزدیک‏‌تر...
ادامه مطلب

تشخیص اسپم

اسپم
تعریف اسپم اگرچه یک تعریف جهانی از اسپم وجود ندارد اما می توان چندین اصطلاح را برای Spam نام‌گذاری کنیم که از آن جمله می‌توان به هرزنامه، ایمیل ناخواسته , ایمیل فله‌ای , یا ایمیل ناخواسته تجاری اشاره کرد، اما رایج‌ترین کلمه مورد استفاده "Spam" می‌باشد پس می‌توان گفت اگر در اینترنت ارسال‌های بی‌جا و نامناسب که دارای محتوای مفیدی برای کاربر نمی‌باشند در مقیاس بزرگی رخ دهند ارسال این ایمیل‌ها به صورت اسپم می‌باشد. البته TREC هم تعریف مشابهی را به این صورت برای اسپم درنظر...
ادامه مطلب

الگوریتم شبکه‌های عصبی مصنوعی

شبکه‌های عصبی
شبکه‌های عصبی مصنوعی شبکه‌های عصبی Artificial neural network از تعداد زیادی عنصر پردازشی فوق‌العاده به‌هم‌پیوسته به نام نرون تشکیل‌شده که برای حل یک مسئله با یکدیگر به‌صورت هماهنگ عمل می‌کند. دسته‌بندی شبکه‌های عصبی شبکه‌ای از لایه‌هاست، معمولاً لایه‌ای که اطلاعات ورودی به آن‌ها داده می‌شود تحت عنوان لایه‌ی ورودی و لایه‌ای که داده‌های خروجی از آن دریافت می‌شود تحت عنوان لایه‌ی خروجی نامیده می‌شود و به لایه‌های دیگر بین این دولایه (در صورت وجود) لایه‌های پنهان گفته...
ادامه مطلب

دیتاست DataSet

دیتاست
دیتاست DataSet یک مجموعه داده (DataSet) مجموعه ای از داده ها است. اغلب مجموعه داده ها مربوط به محتویات یک جدول پایگاه داده تک یا یک ماتریس داده های یکپارچه است که هر ستون جدول یک متغیر خاص را نشان می دهد و هر ردیف مربوط به یک عضو داده شده از مجموعه داده های مورد سوال است. مجموعه داده ها برای هر یک از متغیرها مانند ارتفاع و وزن یک شیء برای هر یک از اعضای مجموعه داده ها فهرست می کند. هر مقدار به عنوان پایه شناخته می شود. مجموعه داده ها ممکن است شامل داده هایی برای یک یا چند عضو باشد که...
ادامه مطلب