تحلیلگر صرفی نور​

پروژه‌ها یکی از نیازهای زیربنایی متن کاوی، تجزیه صرفی و ساخت‌واژی کلمات و شناسایی وندهای کلمه و اطلاعاتی از قبیل نوع کلمه، ریشه، سرواژه (مصدر فعل و مفرد اسم جمع) و … است که در اکثر فعالیت های هوشمند متن‌کاوی از جمله مشابه یابی، رده بندی، بهبود نتایج موتورهای جستجو و … کاربرد دارد. تحلیلگر […]

مشابه‌یابی عناوین هم‌سان

پروژه‌ها روزانه مقالات و اخبار و اسناد متنی فراوانی در محیط رقومی (دیجیتال) تولید و منتشر می‌شود که بررسی درون‌مایه این حجم گسترده اطلاعات، به آسانی امکان‌پذیر نخواهد بود، بلکه مشکلاتی پدید خواهد آورد. شمار فراوان متن‌ها، گوناگونی زبانی آنها، طول‌های مختلف و رمزینه‌های متفاوتشان، از دشواری‌های کار با اسناد متنی به شمار می‌روند. کارشناسان […]

مدلسازی موضوعی​

پروژه‌ها چکیده مدل‌سازی موضوعی در نورمگز با هدف مصورسازی و ارائه‌ی یک بازنمایی موثر مفید از داده‌های این وب سایت توسعه داده شده است. این مهم با استفاده از تحلیل‌های آماری پیچیده موسوم به LDA[1]  میسر شده است. مدل سازی موضوعی[2] استخراج اطلاعات ساختار یافته از لا‌به‌لای متون بدون ساختار محور تمام دستاوردهای فناوری‌های پردازش […]

رده بندی متون​

پروژه‌ها سامانه دسته بند متن نور چکیده سامانه دسته‌بند متون[1] نور در دو زبان عربی و فارسی قابلیت کارکرد دارد. استفاده از یادگیری ماشین سبب شده تا این دستهبند انعطاف قابل قبولی در مقابل متون و کلمات دیده نشده از خود نشان دهد.موارد متعدد استفاده از دسته‌ها و رده‌های متنی در علوم و فنون مختلف، […]