حوزه‌های تحقیقاتی

إیجاد التشابه وتصنیف النصوص

مشابه یابی متون روشی برای ارزیابی شباهت جملات با توجه به ترتیب کلمات است. اگر کلمات یکسان در هر دو جمله به ترتیب یکسان وجود داشته باشند، معمولاً دو جمله مشابه هستند. با این حال، اگر کلمات یک جمله دارای ترتیب متفاوتی با جمله دیگر باشند، جملات باید کاملاً مشابه در نظر گرفته شوند.

رده بندی متون متن یک تکنیک یادگیری ماشینی است که مجموعه ای از دسته بندی های از پیش تعریف شده را به متن باز اختصاص می دهد. … رده بندی متون یکی از وظایف اساسی در پردازش زبان طبیعی با کاربردهای گسترده ای مانند تجزیه و تحلیل احساسات، برچسب گذاری موضوع، تشخیص هرزنامه و تشخیص قصد است.