تُنتج وتُنشر العدید من المقالات والأخبار والوثائق النصیه فی البیئه الرقمیه یومیًا، ولن یکون فحص محتوى هذا الکم الهائل من المعلومات سهلاً، بل سیُثیر مشاکل. یُعدّ العدد الکبیر من النصوص، وتنوعها اللغوی، واختلاف أطوالها، واختلاف رموزها، من بین صعوبات التعامل مع الوثائق النصیه.
وقد بادر خبراء من مختلف المجالات العلمیه إلى حل هذه المشکله. على سبیل المثال، قام خبراء فی الذکاء الاصطناعی، واسترجاع المعلومات، واستخراج البیانات، واستخراج النصوص، وتشابه النصوص، بعملٍ میدانی، وقدموا اقتراحاتٍ مستعینین بخبره استرجاع المعلومات لحل هذه المشاکل. وتُعدّ “مطابقه العناوین المتشابهه” إحدى أدوات البحث عن التشابه، التی تم تطویرها وتقدیمها بناءً على البیانات الوفیره من قاعده بیانات مجله “noormags”.
تُعد “العناوین المتشابهه” میزهً لاکتشاف عناوین المقالات المتشابهه بذکاء، حیث تُقترح، بمساعده تقنیات استخراج النصوص والذکاء الاصطناعی، المقالات الأکثر تشابهًا للمستخدم من منظور العنوان عند عرض کل مقال. یُعدّ العثور على مقالات متعلقه بکل مقاله مسأله بحثیه یجب معالجتها لتنظیم بحث شامل وفرید فی أقصر وقت ممکن. کما أن الطریقه الرئیسیه لتحدید العلاقه بین المقالات هی فحص الکلمات المشترکه بین عناوینها. تستخدم هذه الأداه عناوین المقالات لتحدید علاقتها ببعضها البعض.
لاستخدام أدوات البحث عن التشابهات تطبیقات متعدده، منها ما هو شائع فی قواعد بیانات الأخبار، ومنها تحدید العلاقه بین الأخبار المختلفه. یمکن رؤیه مثال على ذلک فی قسم الأخبار على جوجل[1] أو قسم “فی هذا المجال” فی قاعده بیانات أخبار همشهری[2]. کما تتوفر هذه المیزه فی قواعد البیانات العلمیه، التی یستخدمها ویکیبیدیا[3] فی قسم “انظر أیضًا”.
المیزه الوظیفیه الوحیده فی عملیه البحث عن التشابهات هی عنوان المقالات، إلا أن مصممی Normags حاولوا جعل عملیه البحث عن التشابه تتجاوز المستوى الحرفی لعنوان المقاله، وتقترب من معناها وموضوعها. لذلک، أُجریت اختبارات متنوعه فی قسم استخراج النصوص بمرکز أبحاث العلوم الإسلامیه والحاسوب لتحسین هذا التحول. ومن الأمثله على هذه الحیل تنظیم “طبقه من التجمیع الدلالی للکلمات”. ستؤدی هذه الحیل إلى اکتشاف العدید من علاقات “ارتباط الکلمات”. فارتباط کلمتین یعنی أن وجود إحداهما سیؤدی إلى وجود الأخرى. على سبیل المثال، عند ظهور کلمه مثل “زیت”، من المرجح جدًا استخدام کلمه “غاز” أیضًا. من ناحیه أخرى، یشیر التزامن بین کلمتین إلى قواسم مشترکه بینهما. هذه القواسم المشترکه فی العدید من الکلمات هی سماتها الدلالیه. لذلک، ستکون عملیه التجمیع الدلالی ممکنه بمساعده علاقه التزامن بینهما.
تجدر الإشاره إلى أن الحیل المعتاده فی هذه المیزه تختلف عن محرکات البحث الأخرى، ولها وظائف ناتجه عن أبحاث أجراها باحثون محلیون. ومن بین میزات هذه الأداه تجمیع الکلمات وفصل الکلمات المفتاحیه عن الکلمات الأخرى، وزیاده فعالیتها فی حسابات التشابه.
تأسیس آزمایشگاه هوش مصنوعی و علوم اسلامی و انسانی دیجیتال با تأکید بر نگاه برونسازمانی، گام جدیدی برای همافزایی حداکثری با دانشگاهها، پژوهشگاهها و افراد فعال در حوزه پردازش هوشمند محتوای اسلامی است.
قم – بلوار امین – خیابان جمهوری اسلامی – ساختمان مرکز تحقیقات کامپیوتری علوم اسلامی
صندوق پستی 3857 – 37185
تلفن : 32120212 – 025
دورنگار: 32936294 – 025
رایانامه: info [at] ai.inoor.ir