فی العدید من لغات العالم (الفارسیه، العربیه، إلخ)، یُمیّز استخدام المسافه بین الکلمات ویُمیّزها عن بعضها.
بما أن الحدود بین الکلمات فی الفارسیه تُحدّد بالمسافه بینها، فإن عدم مراعاه المسافه بشکل صحیح یُصعّب قراءه النص ویفقد معناه أو یتغیر.
فی الفارسیه، ووفقًا للمعیار المُعتمد، هناک نوعان من المسافات بین الکلمات: المسافه بین الکلمات فی الجمله، وتُسمّى “مسافه”، والمسافه بین أجزاء الکلمات متعدده الأجزاء، وتُسمّى “نصف مسافه”. إذا رُصدت المسافه ونصف المسافه بشکل صحیح فی النصوص، فسیُحسّن ذلک بشکل کبیر بعض عملیات معالجه اللغه الفارسیه الطبیعیه، مثل اکتشاف الأخطاء الإملائیه، ومحرکات البحث الفارسیه، والتلخیص الفارسی، واستخراج الکلمات المفتاحیه، والترجمه الآلیه، والفهرسه.
على سبیل المثال، قد تُکتب کلمات مثل “الجمهوریه الإسلامیه” خطأً على أنها “الجمهوریه الإسلامیه” أو “البرمجیات” على أنها “برمجیات”. لذلک، قررت مجموعه المعالجه الذکیه فی مرکز نور للعلوم الإسلامیه وأبحاث الحاسوب إطلاق خدمه ذکیه لتصحیح المسافات بین الکلمات. تتمیز هذه الخدمه بقدرتها على تحدید المسافات الصحیحه ونصف المسافات بین الکلمات وتصحیح الأخطاء. فإذا وردت کلمات مثل “الجمهوریه الإسلامیه” فی نص ما، فسیتم تصحیحها إلى “الجمهوریه الإسلامیه” باستخدام هذا النظام.
تأسیس آزمایشگاه هوش مصنوعی و علوم اسلامی و انسانی دیجیتال با تأکید بر نگاه برونسازمانی، گام جدیدی برای همافزایی حداکثری با دانشگاهها، پژوهشگاهها و افراد فعال در حوزه پردازش هوشمند محتوای اسلامی است.
قم – بلوار امین – خیابان جمهوری اسلامی – ساختمان مرکز تحقیقات کامپیوتری علوم اسلامی
صندوق پستی 3857 – 37185
تلفن : 32120212 – 025
دورنگار: 32936294 – 025
رایانامه: info [at] ai.inoor.ir