نظام نور لتصنیف النصوص
ملخص
یعمل نظام نور لتصنیف النصوص[1] باللغتین العربیه والفارسیه. وقد مکّنه استخدام التعلم الآلی من إظهار مرونه مقبوله فی التعامل مع النصوص والکلمات غیر المرئیه. وتشیر الحالات العدیده لاستخدام فئات النصوص وتصنیفاتها فی مختلف العلوم والتقنیات إلى أهمیه هذا النظام.
تصنیف النصوص
یشیر تصنیف النصوص إلى عملیه تحدید موضوع أو أکثر أو تصنیف لنص بناءً على محتواه. تُعد هذه العملیه عملیه أساسیه فی معالجه اللغات الطبیعیه واستخراج النصوص. تتوافر النصوص غیر المنظمه بکثره، ویُعتبر تصنیفها ضروره. یمکن استخدام عملیه التعرف على موضوع النص کبنیه أساسیه لعملیات معالجه اللغات الطبیعیه الأخرى، مثل الترجمه الآلیه، والتعرف الضوئی على الحروف، وتحویل الکلام إلى نص.
یتمیز تصنیف النصوص أیضًا بتنوع کبیر، بدءًا من کشف البرید العشوائی ووصولًا إلى التعرف على عواطف النص.
سیجعل تصنیف النصوص العلمیه من السهل على الباحثین فی مختلف العلوم الوصول إلیها، خاصهً عندما تکون المواضیع أکثر تنوعًا وتتوافق مع الفئات المعروفه. یتمثل التحدی الرئیسی فی استخدام تصنیفات النصوص فی أن النصوص المنشوره فی الفضاء الإلکترونی وغیره من الفضاءات العلمیه الأکادیمیه والحوزات العلمیه قد تفتقر إلى أی تصنیف، أو قد لا تُصنف وفقًا لرأی الباحث.
یکمن الحل الحسابی لهذا التحدی فی استخدام نظام تصنیف النصوص.
نظام نور لتصنیف النصوص
یُستخدم تصنیف نور فی مرکز نور فی مجالین مختلفین، ویمکن تطبیقه أیضًا فی مجالات أخرى مختلفه حسب احتیاجات المستخدمین:
وفی معرض شرحه لمزایا الاقتصاد التعاونی، اعتبر نائب رئیس غرفه التعاون الإیرانیه تعزیز هذا القطاع حلاً لتحقیق شعار “ازدهار الإنتاج”، وقال: “من الممکن تجاوز العقوبات الاقتصادیه والأزمات المالیه العالمیه بتکلفه منخفضه مع ازدهار اقتصادی عادل یعتمد على النماذج المحلیه”. |
نصوص إخباریه فارسیه
نصوص فقهیه عربیه.
تصنیف نصوص الأخبار الفارسیه
تُصنّف نصوص الأخبار الفارسیه حالیًا إلى فئتین: سبعیه وعشریه. على سبیل المثال، یُصنّف النص (الشکل 1) کنص اقتصادی بناءً على التصنیف الفارسی ذی العشریه.
یشمل تصنیف نصوص الأخبار ذات السبعه فئات: الاقتصادیه، والاجتماعیه، والأحداث، والأجنبیه، والسیاسیه، والتکنولوجیه، والریاضیه.
یشمل تصنیف نصوص الأخبار الفارسیه ذی العشریه أیضًا فئات أدبیه-فنیه، وأخبارًا قصیره، وبورصه وبنوک، واقتصاد عالمی، واجتماعیه، وعلمیه، وثقافیه، واقتصادیه، وسیاحیه، ومتفرقات، وأحداث.
تصنیف نصوص الفقه العربیه
یعتمد هذا التصنیف على النصوص العربیه، ویمکنه تصنیف النصوص الفقهیه العربیه إلى الفئات التسعه التالیه:
القصص، والدیات، والحج، والمکاسب، والمیراث، والنکاح، والصلاه، والطهاره، والزکاه.
کلمه أخیره
| الشکل 1: نص یصنف کنص اقتصادی فی تصنیف اللغه الفارسیه للصف العاشر. |
طُوِّر نظام نور لتصنیف النصوص بناءً على الاحتیاجات الحالیه والمحتمله للباحثین المرموقین. لذلک، مع تواصلٍ أکبر وأفضل لهذا المرکز مع الباحثین والعلماء فی مجالات العلوم الإسلامیه والإنسانیه، یُمکن الوصول إلى تصنیفات أکثر تنوعًا فی مجالات أخرى.
نظرًا لأن بنیه التعلم الآلی لتصنیف النصوص مستقله عن اللغه وبنیتها، لا یُمکن إنشاء تصنیفات جدیده – حتى فی لغات أخرى – إلا من خلال إنشاء أو جمع بیانات بتصنیفات مختلفه.
تأسیس آزمایشگاه هوش مصنوعی و علوم اسلامی و انسانی دیجیتال با تأکید بر نگاه برونسازمانی، گام جدیدی برای همافزایی حداکثری با دانشگاهها، پژوهشگاهها و افراد فعال در حوزه پردازش هوشمند محتوای اسلامی است.
قم – بلوار امین – خیابان جمهوری اسلامی – ساختمان مرکز تحقیقات کامپیوتری علوم اسلامی
صندوق پستی 3857 – 37185
تلفن : 32120212 – 025
دورنگار: 32936294 – 025
رایانامه: info [at] ai.inoor.ir