المشاریع

تصحیح المسافه

فی العدید من لغات العالم (الفارسیه، العربیه، إلخ)، یُمیّز استخدام المسافه بین الکلمات ویُمیّزها عن بعضها.

بما أن الحدود بین الکلمات فی الفارسیه تُحدّد بالمسافه بینها، فإن عدم مراعاه المسافه بشکل صحیح یُصعّب قراءه النص ویفقد معناه أو یتغیر.

فی الفارسیه، ووفقًا للمعیار المُعتمد، هناک نوعان من المسافات بین الکلمات: المسافه بین الکلمات فی الجمله، وتُسمّى “مسافه”، والمسافه بین أجزاء الکلمات متعدده الأجزاء، وتُسمّى “نصف مسافه”. إذا رُصدت المسافه ونصف المسافه بشکل صحیح فی النصوص، فسیُحسّن ذلک بشکل کبیر بعض عملیات معالجه اللغه الفارسیه الطبیعیه، مثل اکتشاف الأخطاء الإملائیه، ومحرکات البحث الفارسیه، والتلخیص الفارسی، واستخراج الکلمات المفتاحیه، والترجمه الآلیه، والفهرسه.

على سبیل المثال، قد تُکتب کلمات مثل “الجمهوریه الإسلامیه” خطأً على أنها “الجمهوریه الإسلامیه” أو “البرمجیات” على أنها “برمجیات”. لذلک، قررت مجموعه المعالجه الذکیه فی مرکز نور للعلوم الإسلامیه وأبحاث الحاسوب إطلاق خدمه ذکیه لتصحیح المسافات بین الکلمات. تتمیز هذه الخدمه بقدرتها على تحدید المسافات الصحیحه ونصف المسافات بین الکلمات وتصحیح الأخطاء. فإذا وردت کلمات مثل “الجمهوریه الإسلامیه” فی نص ما، فسیتم تصحیحها إلى “الجمهوریه الإسلامیه” باستخدام هذا النظام.

0 0 رای ها
رأی دهی
اشتراک در
اطلاع از
guest
0 نظر
قدیمی ترین
تازه‌ترین بیشترین واکنش نشان داده شده(آرا)
بازخورد (Feedback) های اینلاین
نمایش همه نظرات