المشاریع

وسم الکیان الاسمی

محرک التعرف على الکیانات الشهیر لمرکز أبحاث علوم الحاسوب الإسلامیه

یُعدّ التعرّف على الأسماء، والفهرسه، واستخدامها کأساس لعملیات آلیه أخرى من أهمّ الأمور التی نحتاجها للتعرّف على الأسماء. تُعدّ أسماء الأشخاص والأفراد والأماکن والمؤسسات، وما شابهها، من الاحتیاجات الأساسیه للباحثین فی مجالات عدیده. للأسباب المذکوره آنفًا، ونظرًا للتکلفه العالیه للتعرّف الیدوی والبشری على الأسماء، وُضِعَ تطویر مُحرّک تعرّف على الأسماء على جدول أعمال مرکز أبحاث العلوم الإسلامیه والحاسوب (نور).

التعرف على الکیان المسمى

یوجد الیوم تعریفات عدیده لمصطلح “الکیان المُسمّى”. تُقدّم بعض المصادر ما یصل إلى 19 تعریفًا مختلفًا للکیان المُسمّى. بشکل عام، الکیانات المُسمّاه هی أسماء الکیانات التی نرغب فی تسمیتها فی سیاق مُحدّد (مثل أسماء الأشخاص، والأماکن، والأدویه، والأمراض، إلخ).

یوجد الیوم تعریفات عدیده لمصطلح “الکیان المُسمّى”. تُقدّم بعض المصادر ما یصل إلى 19 تعریفًا مختلفًا للکیان المُسمّى. بشکل عام، الکیانات المُسمّاه هی أسماء الکیانات التی نرغب فی تسمیتها فی سیاق مُحدّد (مثل أسماء الأشخاص، والأماکن، والأدویه، والأمراض، إلخ).

محرک التعرف على الکیانات الشهیر لمرکز الضوء

حتى الآن، تم اقتراح ثلاثه أسالیب تقلیدیه للتعرف على الکیانات المسماه، وتستخدم أنظمه التعرف على الکیانات المسماه الحدیثه بشکل أساسی مزیجًا من هذه الأسالیب الثلاثه:

الأسالیب القائمه على القاموس

الأسالیب القائمه على القواعد

أسالیب تعتمد على التعلم الآلی.

طُوِّر نظام التعرف على الکیانات الشهیر التابع لمرکز أبحاث الحاسوب للعلوم الإسلامیه باستخدام أحدث تقنیات التعلم الآلی، أی التعلم العمیق، وهو ثنائی اللغه باللغتین الفارسیه والعربیه. یُعد التعلم العمیق نهجًا جدیدًا فی الذکاء الاصطناعی والتعلم الآلی، وقد استُخدم کنهج سائد فی مختلف المجالات خلال العقد الماضی. وقد أدى استخدام تقنیه الذکاء الاصطناعی إلى:

یؤدی النظام وظیفته المطلوبه دون استخدام المفردات. هذا یسمح بتفسیر کلمه واحده موجوده فی موضعین مختلفین فی نصین مختلفین بشکل صحیح. (الشکل 1)

طُوِّر محرک التعرف على الکیانات المُسمَّاه فی مرکز نور باللغتین العربیه والفارسیه. صُمِّم النظام بحیث یُمکِّنه من إجراء عملیات التعرف على الکیانات المُسمَّاه للغات أخرى من خلال تولید بیانات التدریب فقط.[1]

فوائد الاستخدام

إن استخدام المعالجه الحاسوبیه فی التعرف على الکیانات المُسمّاه، واستخدام الذکاء الاصطناعی فی هذا المجال، قد أتاح لمحرک التعرف على الکیانات المُسمّاه المزایا التالیه:

معالجه کمیات هائله من البیانات فی وقت قصیر جدًا.

التعرف على الکیانات المُسمّاه غیر المرئیه من خلال اعتبار محیط الکلمه دلیلًا.

إمکانیه تطویر هذا المحرک للغات أخرى بتکلفه منخفضه جدًا.

عدم الاکتفاء باستخدام الکلمات للتعرف على الکیانات المُسمّاه.

للتعرف على الکیانات المُسمّاه استخدامات عدیده. بالنظر إلى المنتجات الأساسیه للمرکز وآفاقها، یُتوخى اتباع الخطوات التالیه لتطبیق محرک التعرف على الکیانات المُسمّاه.

دمج محرک التعرف على الکیانات المُسمّاه مع محرک بحث Normags لتوفیر نتائج أفضل عند التعامل مع الإعلانات.

إنشاء صفحه إعلانات على موقع Norlib لکل کتاب.

المساعده فی تطویر الأنطولوجیات اللازمه لمشاریع نور الذکیه.

أیضًا، لتحسین استخدام مخرجات محرک التعرف على الکیانات المُسمّاه، یجب اتخاذ خطوتین أساسیتین:

توضیح

إن إزاله الغموض عن الکیان المسمى یعنی أنه إذا کانت هناک أنواع مختلفه من الأسماء لکیان معین فی نص ما، فإن هذه الأسماء المختلفه متصله ببعضها البعض لتوفیر الأساس للخطوه التالیه، وهی مرجع الإعلان.

مرجع الإعلان

قد یتشابه اسم شخصین أو مکانین مختلفین. فی هذه الحاله، یُفضّل ربط عملیه إزاله الغموض بفهرس فرید لتجنب أخطاء تشابه الأسماء فی عملیه معالجه المعلومات واسترجاعها.

إن استخدام هذا المحرک فی إنتاج الفهارس والقوامیس، بالإضافه إلى تحلیل محتوى المعلومات، والبحث النوعی، واسترجاع المعلومات، یُقلّل من تکلفه العملیات البشریه، ویُسرّع بالطبع عملیه البحث.

إن إضافه مخرجات هذا المنتج إلى منتجات أخرى من مرکز نور، مثل موقع Noormags الإلکترونی أو حتى برنامج سطح المکتب من مرکز نور، یُکمّل منظومه البحث فی برنامج نور.

الملحق 1: عینه من مخرجات النظام باللغه العربیهبرچسب‌گذاری موجودیت‌های اسمی

برچسب‌گذاری موجودیت‌های اسمی

الملحق 2: نموذج مخرجات النظام باللغه الفارسیه

برچسب‌گذاری موجودیت‌های اسمی

[1] لمشاهده عرض توضیحی لهذا المنتج والمنتجات الذکیه الأخرى فی مرکز نور، یرجى زیاره هذا العنوان: https://ai.inoor.ir

1 1 رای
رأی دهی
اشتراک در
اطلاع از
guest
0 نظر
قدیمی ترین
تازه‌ترین بیشترین واکنش نشان داده شده(آرا)
بازخورد (Feedback) های اینلاین
نمایش همه نظرات