فی السنوات الأخیره، أصبح موضوع اللغویات الحاسوبیه أحد اهتمامات الباحثین فی مجال علوم الحاسوب واللغویات. وقد أتاح استخدام الحواسیب والأجهزه الذکیه إنجاز العدید من المهام المتعلقه بالنصوص بسرعه ودقه ملحوظتین. کما أتاح القدره على سبر أغوار مجالات کانت صعبه التصور. على سبیل المثال، یمکن ذکر الترجمه الذکیه، ومحرکات البحث الدلالی، والعدید من الأعمال الأخرى فی هذا المجال. کما یمکن أن تکون کل لغه من لغات العالم مخاطبًا لجمیع عملیات المعالجه اللغویه.
یعنی تصنیف المجازات اللغویه الحصول على الشکل الصرفی للکلمات فی النص. على سبیل المثال، وبافتراض مجموعه الوسوم التالیه:


یمکن اعتبار استخدام نموذج مارکوف الخفی لوسم أشکال الکلمات تجریدًا لنظریه الاحتمالات. تُنفَّذ العملیه على النحو التالی:
السؤال هو: فی حاله وجود سلسله من الکلمات، ما هو أفضل ترتیب للوسوم لتلک السلسله؟ إذا مثّلنا النص المُدخل (سلسله من الوحدات الصرفیه فی عملنا) بـ W = (wi)1<i<n، وحددنا سلسله من الوسوم فی مجموعه الوسوم بـ T = (ti)1<i<n، فسیکون هدفنا حساب القیمه التالیه:
![]()
تعبر العلاقه عن احتمال أن تنتمی سلسله العلامات T إلى سلسله الکلمات W. وباستخدام قاعده بایز وإزاله الجزء P(W)، یمکن تغییر العلاقه إلى:
![]()
یمثل P(TlW) احتمال حدوث تسلسل العلامه هذا (احتمالات انتقالات العلامه) ویمکن حسابه بواسطه نموذج N-gram التالی:

کیفیه التطبیع:
![]()
لهذا السبب.
![]()
طریقه الحساب هی کما یلی:

فی هذا المشروع، استخدمنا فی التجارب قاعده بیانات بیجان خان، وهی قاعده بیانات نصیه قیاسیه. تحتوی هذه القاعده على ما یقارب 2.6 ملیون (2,597,937) کلمه مُعَلَّمه من قاعده بیانات همشهری. تتکون مجموعه الوسوم المستخدمه فی هذه القاعده من 40 وسمًا، یمثل کل منها نوعًا صرفیًا. للتجربه، اخترنا ملیونی کلمه من هذه القاعده کبیانات تدریب والباقی کبیانات اختبار. من بین أول ملیونی کلمه، تم رصد 39 وسمًا من أصل 40 وسمًا متاحًا، وتم تعدیل مجموعه الوسوم وفقًا لذلک.
دقه | إعاده القراءه | معیار F |
94.3% | 94.3% | 94.3% |
تأسیس آزمایشگاه هوش مصنوعی و علوم اسلامی و انسانی دیجیتال با تأکید بر نگاه برونسازمانی، گام جدیدی برای همافزایی حداکثری با دانشگاهها، پژوهشگاهها و افراد فعال در حوزه پردازش هوشمند محتوای اسلامی است.
قم – بلوار امین – خیابان جمهوری اسلامی – ساختمان مرکز تحقیقات کامپیوتری علوم اسلامی
صندوق پستی 3857 – 37185
تلفن : 32120212 – 025
دورنگار: 32936294 – 025
رایانامه: info [at] ai.inoor.ir