در این بخش سورس کد الگوریتم هافمن (Huffman) در سی پلاس پلاس ++C قرار داده شده است. این سورس کد برای افراد علاقه مند به برنامه نویسی به زبان سی پلاس پلاس مناسب است زیرا دارای کدهای روان می باشد. در ادامه به توضیح و تشریح الگوریتم هافمن خواهیم پرداخت.
برنامهنویس: تیم برنامه نویسی پی استور
متشکل از اساتید و فارغ التحصیلان رشته های فنی - مهندسی
تیم برنامه نویسی پی استور یکی از اولین گروه های تشکیل شده در مجموعه آموزشی پی استور می باشد. این تیم از اساتید مجرب و فارغ التحصیلان رشته های فنی و مهندسی تشکیل شده که در زمینه های مختلف برنامه نویسی و تهیه سورس کد فعال هستند.
الگوریتم هافمن (Huffman) یکی از الگوریتم های فشرده سازی می باشد که این روش بوسیلهٔ دیوید هافمن توسعه یافت. وی دانشجوی دورهٔ دکتری در دانشگاه MIT بود و در سال ۱۹۵۲ مقالهٔ «روشی برای تولید کدی با کمترین تکرار » را منتشر کرد. در الگوریتم هافمن با توجه به تکرار کارکترها کد باینری به آن ها تعلق می گیرد بدین صورت که برای کاراکترهای با تعداد تکرار بالا کدهای کوتاه و برای کاراکترهای با تکرار کم کدهای با طول بالا. این شیوه در نهایت منجر به ایجاد ساختاری از بیت ها برای ذخیره سازی می شود که فضای کمتری را نسبت به روش های معمولی اشغال می کند.
به بیان دیگر یا علمی تر می توان گفت در کدگذاری هافمن، از روشی خاص برای انتخاب نحوهٔ نمایش هر نماد استفاده میشود. یعنی در این روش رشتهای که نشان دهندهٔ یک کاراکتر خاص است هیچ گاه پیشوند رشتهٔ دیگر که نمایانگر نویسهٔ دیگر است، نمیباشد. در این روش کاراکترهای پرکاربردتر با رشتههای بیتی کوتاهتری نسبت به آنهایی که کاربردشان کمتر است، نشان داده میشوند. دیوید هافمن روشی که کارآمدترین کد برای فشرده سازی از این نوع را می سازد طراحی کرد.
تشریح الگوریتم هافمن
فرض کنید می خواهید تکه اطلاعات زیر رافشرده کنید:
ACDABA
از آنجایی که 6 کاراکتر داریم، این متن 6 بایت یا 48 بیت می باشد. (یعنی برای هر کاراکتر یک بایت ) با رمز گزاری هافمن، فایل برای بیشترین تکرار ظاهر شدن کاراکترها(در این مثال نماد A سه بار تکرار می شود) جستجو می شود و سپس یک درخت ساخته می شود که کاراکترها را با رشته بیت های کوتاه تر جایگزین می کند. در این حالت خاص الگوریتم از جدول جایگزینی زیر استفاده می کند:
A=0 , B=10 , C=110 , D=111.
اگر این کد برای فشرده سازی فایل استفاده شود، اطلاعات فشرده شده به صورت زیر در می آیند:
01101110100
این به این معنی است که 11 بیت به جای 48 بیت مصرف می شود. کد گذاری به روش هافمن، روشی است برای بهینه سازی مقدار حجم استفاده شده برای نگهداری داده های معلوم است.
مراحل روش هافمن
- چگالی هر کاراکتر را محاسبه میکنیم (تعداد دفعات حضور کاراکتر در متن مورد نظر).
- دو کاراکتر با کمترین میزان تکرار (چگالی) را انتخاب میکنیم.
- کاراکتر های مرحله 2 را با کاراکتر جدیدی که دارای چگالی برابر با مجموع چگالی دو کاراکتر فوق است جایگزین میکنیم.
- تا زمانی که فقط یک کاراکتر باقی مانده باشد، به مرحله 2 میرویم.
- از عملیات فوق یک درخت حاصل می شود، بر روی این درخت هر مسیر به سمت چپ با 0 و هر مسیر به سمت راست با 1 وزن دهی میشود.
- کد هر کاراکتر با کنار هم گذاشتن وزن ها از ریشه تا آن کاراکتر به دست می آید.
در الگوریتم هافمن مسئله ادغام دودویی فایل ها استفاده می شود که جهت فشرده سازی فایل ها یا ارسال کم حجم تر اطلاعات بر روی خطوط شبکه مورد استفاده قرار می گیرد . در ابتدا یك جدول درنظر می گیریم در ستون ابتدایی مقادیر (داده ها) را وارد می كنیم در ستون دوم تعداد تكرار داده ها را محاسبه كرده و براساس آن درخت می سازیم سپس یال های چپ را صفر و یال های راست را یك.
در ستون آخر جدول كدهای جدید را که برچسب یالهای درخت حاصله از ریشه تا هر برگ است را درج می كنیم. این برچسب ها را كدینگ هافمن می نامیم. برچسب های جدید کدهای جایگزین کدهای قبلی خواهند شد که در فشرده سازی فایل ها حجم کمتری را به خود اختصاص میدهد . جهت بازگرداندن فایل به حالت اولیه نیز از برعکس همین روش می توان استفاده کرد.
مثالی از نحوه ساختن درخت هافمن
فایل متنی زیر را در نظر بگیرید
xxyzpxxsxyyxpyzrrrzxxqyttq
در این متن تعداد کلمات تکرار شده را مطابق جدول زیر بدست می آوریم.
نمودار درخت هافمن بصورت زیر خواهد بود. که از fi های کوچک باهم جمع شده و تا ریشه درخت ادامه پیدا می کند.
سپس سمت چپ با صفر و سمت راست با یک برچسب گذاری می شود و در نهایت برای پیدا کردن کد یک کاراکتر از ریشه به سمت آن کاراکتر در برگ پی می رویم. جدول زیر کد تولید شده را نشان می دهد.
فضای مصرفی در روش معمولی:
26×8=208 bit
فضای مصرفی در روش هافمن:
∑ fi ×n=16+10+9+8+4+9+8+8=72 bit
سورس کد الگوریتم هافمن در ++C
- یک رشته را بعنوان ورودی می گیرد آنرا به لیستی از CharInfo تبدیل می کند.
- لیست را بر اساس فراوانی sort میکند (صعودی)
- با دو عضو اول لیست یک درخت تشکیل میدهد بطوریکه نود والد جمع دو نود فرزند باشد.
- دو عضو بعدی لیست را انتخاب میکند وبرای انجام مرحله بعدی یک شرط را بررسی میکند.
- توضیح شرط: اگر فراوانی تک تک این دو عضو از مجموع فراوانیهای دو نود ساخته شده در مرحله قبل کمتر باشد تشکیل یک زیردرخت جدید می دهد و درصورت برقرار نبودن شرط تنها یک عضو از لیست انتخاب کرده و با توجه به فراوانی آن تشخیص میدهد که آنرا در سمت چپ درخت قبلی قرار دهد یا در سمت راست.
- به همین منوال درخت پوشای مینیمم تشکیل می شود.
تکه کد تابع اصلی یا Main الگوریتم در سی پلاس پلاس بصورت زیر است:
int main() { char str[100],S; int strarray[124]; int ss=0; char checkCharacter; int count = 0; cout<<"Type the String <1-100> : "<<endl; gets(str); for(int i=0;i<124;i++) { checkCharacter=i; count = 0; for(int j=0;j<strlen(str);j++) { if (str[j] == checkCharacter) { ++ count; } } strarray[i]= count; } for(int i=0;i<124;i++) if(strarray[i]>0) ss++; char *arr=new char[ss]; int *freq=new int[ss]; int j=0; for(int i=0;i<124;i++) { if(strarray[i]>0) { S=i; arr[j]=S; freq[j]= strarray[i]; j++; } } cout<<"frequency of unique character : "<<endl; for(int i=0;i<strlen(arr);i++) { cout<< arr[i]<<" = " <<freq[i]<<endl; } cout<<"\nHuffman Codes:\n"; HuffmanCodes(arr, freq, strlen(arr)); getch(); return 0; }
برای دانلود کامل کد محصول را خریداری نمایید.
ویدئوی معرفی محصول
درباره محصول
سورس کد الگوریتم هافمن به زبان سی پلاس پلاس با استفاده از محیط ++Dev-C نوشته شده است و بصورت کامل توسط گروه پشتیبانی پی استور تست و اجرا شده است محصول دارای نشان تضمین کیفیت پی استور می باشد. برای دانلود محصول آن را خریداری کنید.
مباحث مرتبط با الگوریتم هافمن
مباحث مرتبط با پیمایش درخت در سی پلاس پلاس
تاریخ انتشار: | 31 تیر 1397 |
---|---|
تاریخ بروزرسانی: | 1 دی 1400 |
حجم فایل: | 0.8 مگابایت |
فرمت فایل | CPP |
نسخه: | 2.0 |
هماهنگی با: | Dev-C++ 5 و بالاتر |
تاکنون 377 نفر این محصول را تهیه کرده اند و 1 نظر برای آن ثبت شده است.
نظرات و دیدگاه ها
قوانین ثبت دیدگاه
- لطفاً دیدگاه های خود را فارسی تایپ کنید.
- دیدگاه های نامرتبط به مطلب تایید نخواهد شد.
- از درج دیدگاه های تکراری پرهیز نمایید.
- سوالات تخصصی خودتان را از طریق تیکت پشتیبانی مطرح کنید.
قیمت 49,000 تومان
تاریخ انتشار: | 31 تیر 1397 |
---|---|
تاریخ بروزرسانی: | 1 دی 1400 |
حجم فایل: | 0.8 مگابایت |
فرمت فایل | CPP |
نسخه: | 2.0 |
هماهنگی با: | Dev-C++ 5 و بالاتر |
1 بازخورد (مشاهده نظرات)
قیمت: 49,000 تومان
مدیریت و پشتیبانی
نظرات و دیدگاه های خود را با ما درمیان بگذارید.