تحلیلگر صرفی نور​

پروژه‌ها یکی از نیازهای زیربنایی متن کاوی، تجزیه صرفی و ساخت‌واژی کلمات و شناسایی وندهای کلمه و اطلاعاتی از قبیل نوع کلمه، ریشه، سرواژه (مصدر فعل و مفرد اسم جمع) و … است که در اکثر فعالیت های هوشمند متن‌کاوی از جمله مشابه یابی، رده بندی، بهبود نتایج موتورهای جستجو و … کاربرد دارد. تحلیلگر […]

مشابه‌یابی عناوین هم‌سان

پروژه‌ها روزانه مقالات و اخبار و اسناد متنی فراوانی در محیط رقومی (دیجیتال) تولید و منتشر می‌شود که بررسی درون‌مایه این حجم گسترده اطلاعات، به آسانی امکان‌پذیر نخواهد بود، بلکه مشکلاتی پدید خواهد آورد. شمار فراوان متن‌ها، گوناگونی زبانی آنها، طول‌های مختلف و رمزینه‌های متفاوتشان، از دشواری‌های کار با اسناد متنی به شمار می‌روند. کارشناسان […]

مدلسازی موضوعی​

پروژه‌ها چکیده مدل‌سازی موضوعی در نورمگز با هدف مصورسازی و ارائه‌ی یک بازنمایی موثر مفید از داده‌های این وب سایت توسعه داده شده است. این مهم با استفاده از تحلیل‌های آماری پیچیده موسوم به LDA[1]  میسر شده است. مدل سازی موضوعی[2] استخراج اطلاعات ساختار یافته از لا‌به‌لای متون بدون ساختار محور تمام دستاوردهای فناوری‌های پردازش […]

رده بندی متون​

پروژه‌ها سامانه دسته بند متن نور چکیده سامانه دسته‌بند متون[1] نور در دو زبان عربی و فارسی قابلیت کارکرد دارد. استفاده از یادگیری ماشین سبب شده تا این دستهبند انعطاف قابل قبولی در مقابل متون و کلمات دیده نشده از خود نشان دهد.موارد متعدد استفاده از دسته‌ها و رده‌های متنی در علوم و فنون مختلف، […]

مشابه یابی معنایی احادیث​

پروژه‌ها گاهی دو حدیث به لحاظ لفظی، حاوی دنباله کلمات مشترک نیستند اما دقیقا به یک مفهوم اشاره می کنند. تعریف حدیث مرتبط اعم از تطابق مفهومی، ارتباط نسبی، تضاد ظاهری و استخراج کلمات مرتبط بر اساس تحلیل هم‌رخدادی کلمات در انبوه احادیث محاسبه امتیاز تشابه دو حدیث بر اساس برآیند تشابه کلمات آنها