هم‌ترازی جملات فارسی و عربی

در این سرویس با استفاده از یک مدل تعبیه‌ساز جملات مبتنی بر محتوا، جفت جملات متناظر موجود در متون عربی و فارسی به یکدیگر متصل می‌شوند. نمونه وعن الصادق علیه السلام من قرأ سوره الصافات فی کل جمعه لم یزل محفوظا من کل آفه. مدفوعا عنه کل بلیه فی حیاه الدنیا. مرزوقا بأوسع ما یکون […]

شناسایی زبان

در این سرویس با استفاده از یک مدل طبقه‌بندی مبتنی بر یادگیری ماشین، زبان متن، تشخیص داده می‌شود.  نمونه از حضرت صادق علیه السلام روایت شده که فرمود کسى که سورۀ صافات را در هر روز جمعه بخواند از هر آفتى همواره محفوظ مى ماند.

آیات مرتبط

پروژه‌ها هر یک از آیات قرآن در برگیرنده مفهوم یا مفاهیمی است که با توجه به شأن نزول آیات و بیان کنایی و تمثیلی قرآن، شناسایی و استخراج این مفاهیم باید توسط خبره و دانشمندان علوم قرآنی انجام شود. تفاسیر قرآن، منابع ارزشمندی هستند که نظرات خبرگان قرآنی در آنها بیان گردیده است و با […]

برچسب گذاری صرفی کلمات فارسی​

پروژه‌ها در سالهای اخیر مساله زبان‏شناسی محاسباتی یکی از دغدغه‌‏های محققین حوزه کامپیوتر و زبان‏شناسی شده است. استفاده از کامپیوتر و ابزارهای هوشمند باعث شده‌‏اند که بتوان بسیاری از کارهای مرتبط با متن را با سرعت و دقتی قابل توجه انجام داد. علاوه‏بر‏این، قدرت وارد شدن به عرصه‌‏هایی را که تصور آنها نیز مشکل بوده […]

اعراب‌گذاری​

پروژه‌ها ابزار “اعراب‌گذار” خودکار زبان عربی می‌تواند با دقت بالا متون عربی حوزه علوم اسلامی را حرکه‌گذاری نماید.  دقت این سامانه در متون حدیثی بدون درنظرگرفتن حرکت آخر کلمه به بالای 95% هم می‌رسد.  برای پیاده‌سازی این ابزار از پیکره مدل زبانی 400 جلد کتاب اعراب‌خورده مرکز تحقیقات کامپیوتری علوم اسلامی استفاده شده است.

تصحیح فاصله​

پروژه‌ها در بسیاری از زبان‌های موجود در دنیا (فارسی، عربی،…)، استفاده از کاراکتر فاصله باعث شناسایی کلمات و تمایز آنها از یکدیگر می شود. با توجه به اینکه در زبان فارسی مرز میان کلمات با فاصله از یکدیگر مشخص می‌شوند، در صورتی که فاصله به‌ درستی رعایت نشود، باعث عدم خوانایی نوشته می‌شود و معنای آن […]

ریشه یابی کلمات عربی – پیراسته سازی​

پروژه‌ها استم (میانوند) Stem: یک الگوریتم محاسباتی که کلمات هم ریشه را با تهی نمودن آن‌ها از پیشوندها و پسوندها به یک شکل مشترک باز می‌گرداند که می‌توان جایگزین آن از معادل فارسی «پیراسته»، «میانوند» یا «هسته» نیز استفاده نمود؛ به طور مثال کلمات عربی «یعلمون»، «سیعلمان»، «یعلمن»، «فیعلمونه» و «أیعلم؟» که همگی از ریشه […]