من الاحتیاجات الأساسیه لتعدین النصوص التحلیل الصرفی والصوتی للکلمات، وتحدید جذورها، ومعلومات مثل نوعها، وجذرها، وکلمه الرأس (جذر الفعل، وجمع الاسم المفرد)، وغیرها، وهو ما یُستخدم فی معظم أنشطه تعدین النصوص الذکیه، بما فی ذلک إیجاد أوجه التشابه، وترتیب الکلمات، وتحسین نتائج محرکات البحث، وغیرها.
یتکون محلل نور الصرفی من جزأین رئیسیین: جوهر التحلیل الصرفی للکلمات باستخدام تقنیات قائمه على القواعد، ونظام فرز التحلیل باستخدام تقنیات التعلم الآلی.
فی المرحله الأولى، تُجرى عملیات مثل تحدید البادئات واللواحق، وتحدید الحروف الرئیسیه للکلمه، وتحلیل متخصص للقواعد اللغویه العربیه (بما فی ذلک الظروف، وعملیات الدمج، والاستبدال، وغیرها). خلال هذه العملیات، تُستخدم مجموعات البیانات اللغویه الطرفیه (مثل بنک الکلمات العربیه المتماسکه، والجمع المرکب، والصفات المتشابهه، وغیرها)، وأخیرًا، تُعرض جمیع التحلیلات الممکنه للکلمه، بالإضافه إلى أکثر من 20 خاصیه تعریف صرفیه.
فی المرحله الثانیه، بعد إنشاء مجموعه من التحلیلات الصرفیه المحتمله لکلمه ما، یتم تسجیل التحلیلات باستخدام أسالیب التعلم الآلی وتحلیل الکلمات المجاوره، واستخدام مجموعات من النصوص تم التحقق من صحتها مسبقًا من قبل البشر.

من أهم تطبیقات أدوات التحلیل الصرفی تحدید الکلمات المرتبطه بکلمه واحده. وفی هذا الصدد، استُخدم محلل نور الصرفی لتحسین نتائج محرکات البحث فی قواعد البیانات مثل القاموس، والحدیث، ونور لاب، وغیرها.
کما استُخدمت هذه الأداه لإنتاج مجموعه صرفیه خاصه بالقرآن الکریم.

تأسیس آزمایشگاه هوش مصنوعی و علوم اسلامی و انسانی دیجیتال با تأکید بر نگاه برونسازمانی، گام جدیدی برای همافزایی حداکثری با دانشگاهها، پژوهشگاهها و افراد فعال در حوزه پردازش هوشمند محتوای اسلامی است.
قم – بلوار امین – خیابان جمهوری اسلامی – ساختمان مرکز تحقیقات کامپیوتری علوم اسلامی
صندوق پستی 3857 – 37185
تلفن : 32120212 – 025
دورنگار: 32936294 – 025
رایانامه: info [at] ai.inoor.ir