یکی از مباحث مهم در پیاده سازی های سیستم های تشخیص نفوذ، استفاده از دیتاست های مناسب است. در این میان دیتاست KDD99 یا همان KDDCUP99 یک دیتاست کامل و کاربردی است که برای الگوریتم های یادگیری ماشین استفاده می شود. از مشکلات اصلی پس از پیدا کردن یک دیتاست مناسب، نحوه استفاده و تزریق آن به الگوریتم ها است. بدین صورت که اکثر دیتاست ها یا مجموعه داه ها بصورت خام هستند و برای استفاده از آن ها بایستی پیش پردازش شوند.
تیم برنامه نویسی پی استور یکی از اولین گروههای تشکیل شده در مجموعه آموزشی پی استور میباشد. این تیم از اساتید مجرب و فارغ التحصیلان رشتههای فنی و مهندسی تشکیل شده که در زمینههای مختلف برنامهنویسی و تهیه سورس کد فعال هستند.
احتمالا در موارد بسیار زیادی داده ها در دیتاست ها دارای نوع متفاوتی باشند (رشته، عدد) که نحوه تبدیل آنها به فرمت مخصوص الگوریتم ها با ابعا گسترده دیتاست ها کاری طاقت فرسا است. مخصوصا اینکه برای مشاهده نتیجه پس از اجرای کد بایستی چندین ساعت منتظر ماند. در این پست در ادامه به تشریح دیتاست KDD99 پرداخته می شود و محصول آماده که در متلب نوشته شده ارائه می گردد.
تبدیل دیتاست KDD99 در متلب
دیتاست KDD99 به عنوان یك دادهی استاندار برای ارزیابی سیستم های تشخیص نفوذ پذیرفته شده و مورد استفاده قرارگرفته است. این داده اعتبار خود را از سومین مسابقه بین الملی كشف دانش و داده كاوی كسب كرده است. گروه IST از آزمایشگاه MIT Lincoln زیر نظر DARPA و AFRL/SNHS ، اولین داده های استاندارد برای بررسی و ارزیابی سیستم های تشخیص نفوذ را جمع آوری نمودند.
این اطلاعات در طول چند هفته در یك شبیه سازی برای آزمایش سیستم تشخیص نفوذ DARPA به كار رفته اند. این مجموعه داده ها براساس سال جمع آوری اطلاعات ( 1998 – 1999 ) طبقه بندی شده است. دیتاست KDD99 شامل ركوردهای اتصال استانداردی می باشد كه مجموعه ای از حملات و نفوذهای شبیه سازی شده در یك شبكه نظامی را شامل می شود.
یك اتصال با پروتكل TCP ،UDP و یا ICMP است كه در زمان های مشخص شروع و پایان می یابد و بین آن زمان ها، داده ها از آدرس IP مبدأ به آدر س IP مقصد و برعكس تحت یك پروتکل تعریف شده جریان دارند. هر اتصال به عنوان نرمال (Normal) یا حمله (Attack) برچسب گذاری می شود و در مورد حمله، نوع آن دقیقاً مشخص می گردد.
حملاتی كه در این مجموعه داده مشاهده می شوند، در چهار دسته اصلی U2R ،R2L ، DOS و Probe قرار می گیرند. دیتاست KDD99 در قالب چند فایل سازماندهی گردیده اند. در این مجموعه از فایل ها، دو فای به نام های 10_percent و corrected وجود دارند كه در بسیار ی از پژوهش ها از دیتاست 10_percent برای آموزش و آزمایش سیستم های طراحی شده به استفاده میگردد.
جزئیات دیتاست KDD99
مجموعه داده KDD99 یا همان فایل 10_percent در مخزن داده ای UCI موجود است و می توانید از این لینک (+) دانلود کنید. همانطور که قبلا هم گفته شد حملاتی كه در این مجموعه داده مشاهده می شوند، در چهار دسته اصلی U2R ،R2L ، DOS و Probe قرار می گیرند. اما در خود فایل 10_percent در 23 دسته مختلف قرار دارد از این رو طبق مقالات و رفرنس های متنوع ما نیز این دسته بندی را بصورت زیر در 4 گروه انجام می دهیم. و اعداد جلوی آنها مربوط به تعداد رکوردهای موجود است.
There are total of 23 types of attack, and all of them belong to the four main attack categories (DoS, R2L, U2R, Probing) and normal.
%normal.=normal. =97278
%DoS=back. land. neptune. pod. smurf. teardrop. =391458
%R2L=warezclient. warezmaster. spy. multihop. phf. ftp_write. guess_passwd. imap.=1126
%U2R=rootkit. perl. loadmodule. buffer_overflow.= 52
%Probing=portsweep. satan. ipsweep. nmap.= 4107
بنابراین ما 5 کلاس داریم که یک کلاس مربوط به حالت نرمال و 4 کلاس مربوط به حمله است. تعداد کل داده های 10 درصدی494021 رکورد می باشد. این دیتاست شامل 41 ویژگی یا ستون است و ستون 42 نیز معرف نوع حمله یا نرمال بودن است. در زیر تصویری از این دیتاست مشاهده می شود.
هر کدام از ستون ها معرف یک خصیصه از یک اتصال است که در فایل دانلودی از سایت UCI قابل مشاهده است.
ویدئوی معرفی محصول
درباره محصول
مباحث مرتبط با سیستم های تشخیص نفوذ
اطلاعات تکمیلی محصول
نام محصول: | تبدیل دیتاست KDD99 برای استفاده الگوریتم های یادگیری ماشین در متلب |
---|---|
نوع محصول: | سورس کد |
حجم فایل: | 4 مگابایت |
فرمت فایل: | m. در قالب متلب |
قابل اجرا در: | Matlab 2014 و بالاتر |
تضمین کیفیت و گارانتی بازگشت هزینه
توجه: کیفیت این محصول توسط پی استور تضمین شده و در صورت عدم رضایت از محصول، به انتخاب شما:
- ۱۰۰ درصد مبلغ پرداختی در حساب کاربری شما شارژ میشود.
- و یا 80 درصد مبلغ پرداختی به حساب بانکی شما عودت داده میشود.
تبدیل دیتاست KDD99 برای استفاده الگوریتم های یادگیری ماشین در متلب
حجم فایل: | 4 مگابایت |
---|---|
فرمت فایل | m. در قالب متلب |
هماهنگی با: | Matlab 2014 و بالاتر |
تضمین کیفیت: | دارای گارانتی 7 روزه بازگشت وجه |
سفارش تدریس: | تدریس خصوصی آنلاین |
تاکنون 640 نفر این محصول را تهیه کرده اند و 2 نظر برای آن ثبت شده است.
نظرات و دیدگاه ها
قوانین ثبت دیدگاه
- لطفاً دیدگاه های خود را فارسی تایپ کنید.
- دیدگاه های نامرتبط به مطلب تایید نخواهد شد.
- از درج دیدگاه های تکراری پرهیز نمایید.
- سوالات تخصصی خودتان را از طریق تیکت پشتیبانی مطرح کنید.
تبدیل دیتاست KDD99 برای استفاده الگوریتم های یادگیری ماشین در متلب
هزینه سفارش: 99,000 تومان
حجم فایل: | 4 مگابایت |
---|---|
فرمت فایل | m. در قالب متلب |
هماهنگی با: | Matlab 2014 و بالاتر |
تضمین کیفیت: | دارای گارانتی 7 روزه بازگشت وجه |
سفارش تدریس: | تدریس خصوصی آنلاین |
2 بازخورد (مشاهده نظرات)
هزینه سفارش: 99,000 تومان
علی فاخری
خیلی خوب و تمیز بود. با اینکه خودم بارها می خواستم این دیتاست رو برای الگوریتم ترکیبی خودم اعمال کنم ولی موفق نشده بودم. این دیتاست پردازش شده کارم رو خیلی آسون کرد.
مدیریت و پشتیبانی
نظرات و دیدگاه های خود را با ما درمیان بگذارید.