مشابه‌یابی عناوین هم‌سان

پروژه‌ها روزانه مقالات و اخبار و اسناد متنی فراوانی در محیط رقومی (دیجیتال) تولید و منتشر می‌شود که بررسی درون‌مایه این حجم گسترده اطلاعات، به آسانی امکان‌پذیر نخواهد بود، بلکه مشکلاتی پدید خواهد آورد. شمار فراوان متن‌ها، گوناگونی زبانی آنها، طول‌های مختلف و رمزینه‌های متفاوتشان، از دشواری‌های کار با اسناد متنی به شمار می‌روند. کارشناسان […]

مدلسازی موضوعی​

پروژه‌ها چکیده مدل‌سازی موضوعی در نورمگز با هدف مصورسازی و ارائه‌ی یک بازنمایی موثر مفید از داده‌های این وب سایت توسعه داده شده است. این مهم با استفاده از تحلیل‌های آماری پیچیده موسوم به LDA[1]  میسر شده است. مدل سازی موضوعی[2] استخراج اطلاعات ساختار یافته از لا‌به‌لای متون بدون ساختار محور تمام دستاوردهای فناوری‌های پردازش […]

رده بندی متون​

پروژه‌ها سامانه دسته بند متن نور چکیده سامانه دسته‌بند متون[1] نور در دو زبان عربی و فارسی قابلیت کارکرد دارد. استفاده از یادگیری ماشین سبب شده تا این دستهبند انعطاف قابل قبولی در مقابل متون و کلمات دیده نشده از خود نشان دهد.موارد متعدد استفاده از دسته‌ها و رده‌های متنی در علوم و فنون مختلف، […]

مشابه یابی معنایی احادیث​

پروژه‌ها گاهی دو حدیث به لحاظ لفظی، حاوی دنباله کلمات مشترک نیستند اما دقیقا به یک مفهوم اشاره می کنند. تعریف حدیث مرتبط اعم از تطابق مفهومی، ارتباط نسبی، تضاد ظاهری و استخراج کلمات مرتبط بر اساس تحلیل هم‌رخدادی کلمات در انبوه احادیث محاسبه امتیاز تشابه دو حدیث بر اساس برآیند تشابه کلمات آنها

تقلب یابی متون​

پروژه‌ها دست‌برد فکری (plagiarism)، عبارت است از قلمداد کردن ایده‌ها، جملات یا اثر شخص دیگر، به مثابه ایده، جمله یا اثر خود. این کار، شکلی از فریب‌کاری و  خیانت در امانت علمی است. (Ballard, 2010, p. 1) باز استفاده از متن، عبارت از استفاده عمدی یا غیر عمدی از متن موجود برای ایجاد یک متن جدید […]