تجزیه تحلیل ساختار جملات انگلیسی با یادگیری ماشین در سی شارپ

ساختار جملات انگلیسی یکی از مهم ترین مباحث در علوم زبان شناسی و ترجمه می باشد. با توجه به اهمیت این زبان بین المللی تجزیه و تحلیل ساختار این زبان یکی از چالش های محققان در چند دهه اخیر می باشد. در این پست تجزیه تحلیل ساختار جملات انگلیسی با یادگیری ماشین در سی شارپ ارائه کرده ایم. که به بررسی ساختار جملات انگلیسی می پردازد. این پروژه در Microsoft Visual Studio 2013 نوشته شده است.

پردازش زبان‌های طبیعی (NLP) یکی از زیرشاخه‌های بااهمیت در حوزه‌ی گسترده علوم کامپیوتر، هوش مصنوعی و نیز دانش زبان‌شناسی محاسباتی است که به تعامل بین کامپیوتر و زبان‌های (طبیعی) انسانی می‌پردازد؛ بنابراین پردازش زبان‌های طبیعی بر ارتباط انسان و کامپیوتر، متمرکز است.

به‌طورکلی تاریخچه پردازش زبان طبیعی از دهه ۱۹۵۰ میلادی شروع می‌شود. در ۱۹۵۰ آلن تورینگ مقاله معروف خود را درباره‌ی آزمایش تورینگ که امروزه به‌عنوان ملاک هوشمندی شناخته می‌شود، منتشر ساخت. نخستین تلاش‌ها برای ترجمه توسط کامپیوتر ناموفق بودند، به‌طوری‌که ناامیدی بنگاه‌های تأمین بودجه‌ی پژوهش از این حوزه را نیز در پی داشتند. پس از اولین تلاش‌ها آشکار شد که پیچیدگی زبان بسیار بیشتر از چیزی است که پژوهشگران در ابتدا پنداشته بودند. بی‌گمان حوزه‌ای که پس‌ازآن برای استعانت موردتوجه قرار گرفت زبان‌شناسی بود.

 

هدف

هدف اولیه هر برنامه NLP ایجاد یک درخت تجزیه برای یک جمله متعلق به مجموعه آن زبان است. برای طبقه‌بندی صحیح کلمات که به کدام نوع خاص تعلق دارد به مدل زبان تکیه می‌شود. برای مشخص کردن این طبقه‌بندی از الگوریتم‌های یادگیری ماشین استفاده می‌شود.

ماشین یادگیر با استفاده از الگوریتم‌های مخصوص شروع به یادگیری جایگاه و نوع کلمات می‌نماید و سپس برای جملات جدید با استفاده از یادگیری خود اقدام به طبقه‌بندی می‌نماید. با مشخص شدن نوع جملات با استفاده از مدل‌های منطقی می‌توان درخت تجزیه جملات را رسم کرد. در این پروژه از مجموعه‌ای شامل نمونه‌های بیش از 100000 جمله از جملات زبان انگلیسی است که با استفاده از الگوریتم‌های یادگیری آموزش داده‌شده است استفاده شده است و با استفاده از زبان برنامه‌نویسی C# درخت تجزیه جملات به‌درستی به‌دست‌آمده است.

 

پیاده‌سازی ساختار جملات با استفاده از C#

برای پیاده‌سازی ساختار جملات انگلیسی با استفاده از سی شارپ  C# احتیاج به توابع کتاب‌خانه‌ای تعیین جملات، تعیین کلمات، عبارت‌ها و … داریم که این توابع با استفاده از الگوریتم‌های یادگیری گردآوری‌شده است و به زبان Java موجود است این فایل‌ها طبق شکل زیر عبارت‌اند از:

ساختار جملات انگلیسی

محتویات این فایل‌ها به‌صورت کد جاوا است و شامل نمونه‌های بیش از 100000 جمله از جملات زبان انگلیسی است که با استفاده از الگوریتم‌های یادگیری آموزش داده‌شده است. اختصارات مورداستفاده در این پروژه بصورت زیر است.

ساختار جملات انگلیسی nlp

برای بررسی کار گرد ساختار جملات انگلیسی در سی شارپ #C ابتدا باید اختصارات استفاده‌شده در برنامه نیز تشریح شوند (به‌عنوان‌مثال برای ضمایر چند نوع ضمیر داریم) که PDF زیر نشان‌دهنده این اختصارات هستند.

با ترکیب و قرار دادن انواع کلمات در کنار هم عبارات یا Phrase تشکیل داده می‌شود عبارت‌ها انواع مختلفی دارند مانند عبارت اسمی، عبارت فعلی، عبارت قیدی و … انواع این عبارت‌ها در جدول زیر نشان داده‌شده است.

ساختار جملات انگلیسی

پس از مشخص کردن نوع کلمات بایستی نوع عبارت را به دست بیاوریم که بقیه توضیحات در فایل PDF زیر موجود است.

 

خروجی پروژه

ویدئوی معرفی محصول

این پروژه بااستفاده از زبان برنامه نویسی سی شارپ در microsoft visual studio 2013 نوشته شده است. پروژه توسط کارشناسان پی استور تست و بررسی شده است و مورد تایید پی استور می باشد. این محصول دارای نشان تضمین کیفیت پی استور می باشد. برای دانلود پروژه آن را خریداری کنید. به محض خریداری لینک دانلود در دسترس خواهد بود.

77,000 تومان

 

2 دیدگاه برای تجزیه تحلیل ساختار جملات انگلیسی با یادگیری ماشین در سی شارپ

  1. امتیاز 5 از 5

    programstore

    نظرات و دیدگاه های خود را با ما درمیان بگذارید.

  2. امتیاز 5 از 5

    ایمان بخشی

    خیلی وقت بود تو تشخیص جملات برای ترجمه تو زبان انگلیسی تحقیق می کردم. این فایل شما واقعا کامل و جامع هست من دانلود کردم واقعا دستتون درد نکنه.

دیدگاه خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.

اطلاعات فروشنده