الگوریتم Apriori یکی از روش های پر کاربرد برای کاوش مجموعه اقلام تکرار شده و قواعد وابستگی association rule mining در بحث داده کاوی و یادگیری ماشین است.
الگوریتم Apriori
الگوریتم اپریوری Apriori از اولین الگوریتمهایی است که جهت یافتن مجموعه اقلام تکرار شده از آن استفاده میشود. نام این الگوریتم برگرفته از شیوهای است که از آن استفاده میکند، یعنی استفاده از دانش مرحله قبل که در ادامه آن را تشریح میکنیم. الگوریتم Apriori توسط اگراوال Agrawal و همکاران، در مرکز تحقیقات IBM Almaden کشف شد و میتوان آن را برای تولید کلیه مجموعه اقلام تکرار شده بکار برد.
الگوریتم Apriori یک الگوریتم جستجوی سطحی است، که با پایان کاوش در مرحله k ام به مرحله بعدی یعنی k+1 میرود. این عمل تا محقق شدن شرط یا شروط پایانی تکرار میشود. در مرحله k ام مجموعه اقلام k تایی تولید خواهند شد. پس از محاسبه مقدار پشتیبان برای هرکدام و مقایسه آن با مقدار minsup الگویهای مکرر k تایی شناسایی میشود.
در مرحله بعدی الگوریتم با کمک الگوهای مکرر k تایی، مجموعه اقلام (k+1) تایی کاندید که بالقوه میتوانند مکرر باشند را تولید میکند. به همین ترتیب با توجه به مقدار minsup برخی حذف شده و مجموعه اقلام مکرر (k+1) تایی تشکیل خواهند شد.
این عمل تا یافتن آخرین مجموعه قلم مکرر ادامه پیدا میکند. این الگوریتم در حین اجرا از قاعدههای موسوم به قاعده Apriori استفاده میکند که بدین صورت بیان میشود: “اگر یک الگوی مکرر داشته باشیم، کلیه زیرمجموعههای آن نیز مکرر هستند.” به عبارت دیگر اگر مجموعه اقلام I مکرر نباشد، هر مجموعهای که شامل I است نیز نمیتواند مکرر باشد.