پروژه‌ها

حدیث یاب​

این سرویس برای پیدا کردن متن احادیث عربی در متون دینی و پیوند دهی آنها  به پایگاه جامع الاحادیث است. پایگاه جامع الاحادیث پایگاهی تخصصی حاوی کتب معروف روایی شیعه است. با پیونددهی متن یک حدیث به پایگاه جامع الاحادیث زمینه استفاده پژوهشگر از منبع دقیق حدیث، ترجمه‌ها و شرح‌ها و احادیث مشابه و سایر امکانات برای او فراهم می‌شود.

این سرویس قابلیت این را دارد که متن ساده و یا فرمت html که در وبسایت‌ها استفاده می‌شود را پردازش کند و خروجی حاوی متن حدیث پیوند یافته دقیقاً با همان فرمت قبلی را به کاربر ارائه دهد. از این روی می‌توان بدون تغییر خاصّی وبسایت مورد نظر با احادیث پیوندداده شده را در پایگاه شخصی خود قرار داد.

الگوریتم کار در یک ساختار چند مرحله‌ای صورت می‌گیرد تا بتواند دقت و سرعت لازم را همزمان برای ما تامین کند. ابتدا متن ورودی به شکل نرمال در می‌آید و سپس تفسیم به چند کلمه‌ای ها[1]  می شود که به جستجوی پیاپی هر کدام از این چند کلمه‌ای ها در مجموعه عظیم حدود 400 هزار حدیث سایت اقدام می‌شود در مرحله بعد با استفاده از الگوریتم تطبیق تقریبی مخصوصی که با استفاده از بررسی چند حرفی‌های پیاپی[2] کار می‌کند  به بررسی تطبیق هر کدام از احادیث احتمالی کاندید قابل قبول می‌پردازیم و بهترین تطبیق‌ها را بر می‌گزینیم در نهایت  احادیث پیدا شده خروجی به وسیله روش‌های مختلف از جمله بررسی صرفاً آیه بودن، صرف سند حدیث بودن (با الگوریتم پارس مخصوص) و صرف بودن عبارات پرتکرار و بررسی طول و میزان عبارت تطبیق و  غیره فیلتر شده‌اند تا نتایج نامطلوب با صرف شباهت لفظی ظاهری با قسمتی از احادیث در خروجی قرار نگیرند.

این برنامه می‌تواند در هر ثانیه حدود 10  صفحه از متون پرحدیث را بروی سرور مرکز با دقت حدیث یابی کند.

[1] N-gram words

[2] N-gram characters

0 0 رای ها
رأی دهی
اشتراک در
اطلاع از
guest
0 نظر
بازخورد (Feedback) های اینلاین
نمایش همه نظرات