این سرویس برای پیدا کردن متن احادیث عربی در متون دینی و پیوند دهی آنها به پایگاه جامع الاحادیث است. پایگاه جامع الاحادیث پایگاهی تخصصی حاوی کتب معروف روایی شیعه است. با پیونددهی متن یک حدیث به پایگاه جامع الاحادیث زمینه استفاده پژوهشگر از منبع دقیق حدیث، ترجمهها و شرحها و احادیث مشابه و سایر امکانات برای او فراهم میشود.
این سرویس قابلیت این را دارد که متن ساده و یا فرمت html که در وبسایتها استفاده میشود را پردازش کند و خروجی حاوی متن حدیث پیوند یافته دقیقاً با همان فرمت قبلی را به کاربر ارائه دهد. از این روی میتوان بدون تغییر خاصّی وبسایت مورد نظر با احادیث پیوندداده شده را در پایگاه شخصی خود قرار داد.
الگوریتم کار در یک ساختار چند مرحلهای صورت میگیرد تا بتواند دقت و سرعت لازم را همزمان برای ما تامین کند. ابتدا متن ورودی به شکل نرمال در میآید و سپس تفسیم به چند کلمهای ها[1] می شود که به جستجوی پیاپی هر کدام از این چند کلمهای ها در مجموعه عظیم حدود 400 هزار حدیث سایت اقدام میشود در مرحله بعد با استفاده از الگوریتم تطبیق تقریبی مخصوصی که با استفاده از بررسی چند حرفیهای پیاپی[2] کار میکند به بررسی تطبیق هر کدام از احادیث احتمالی کاندید قابل قبول میپردازیم و بهترین تطبیقها را بر میگزینیم در نهایت احادیث پیدا شده خروجی به وسیله روشهای مختلف از جمله بررسی صرفاً آیه بودن، صرف سند حدیث بودن (با الگوریتم پارس مخصوص) و صرف بودن عبارات پرتکرار و بررسی طول و میزان عبارت تطبیق و غیره فیلتر شدهاند تا نتایج نامطلوب با صرف شباهت لفظی ظاهری با قسمتی از احادیث در خروجی قرار نگیرند.
این برنامه میتواند در هر ثانیه حدود 10 صفحه از متون پرحدیث را بروی سرور مرکز با دقت حدیث یابی کند.
[1] N-gram words
[2] N-gram characters
تأسیس آزمایشگاه هوش مصنوعی و علوم اسلامی و انسانی دیجیتال با تأکید بر نگاه برونسازمانی، گام جدیدی برای همافزایی حداکثری با دانشگاهها، پژوهشگاهها و افراد فعال در حوزه پردازش هوشمند محتوای اسلامی است.
قم – بلوار امین – خیابان جمهوری اسلامی – ساختمان مرکز تحقیقات کامپیوتری علوم اسلامی
صندوق پستی 3857 – 37185
تلفن : 32120212 – 025
دورنگار: 32936294 – 025
رایانامه: info [at] ai.inoor.ir