مقالات​

بهبود برچسب گذاری ادات سخن کلمات ناشناخته‌ی متون فارسی به کمک قوانین انجمنی

نویسندگان
مینایی، بهروز ؛ الهی منش، محمدحسین
چکیده
این مقاله یکی از دغدغه‌های بزرگزبان‌شناسی محاسباتی یعنیبرچسب‌گذاری ادات سخن کلمات ناشناخته را مورد بحث و تحقیق قرار داده است. برچسب‌گذاری ادات سخن که یکی از پایه‌ای‌ترین نیازهای پردازش هوشمند متن به حساب می‌آید، وابسته به زبان متن مورد پردازش است. از این رو فراهم‌سازی برچسب‌گذاربا دقت بالا برای زبان فارسی جزو اولویت‌های کار نویسندگان مقاله قرار گرفته است. تکنیک مورد کاربرد ما برای حل مسأله‌ی کلمات ناشناخته،استفاده‌ی ترکیبی از الگوریتممدل مخفی مارکف به همراه قوانین انجمنی بوده است. الگوریتم مدل مخفی مارکف در بسیاری از برچسب‌گذارهای ادات سخن گذشته به کار گرفته شده[2,3]است و جزو بهترین متدهای مورد استفاده در برچسب‌گذارها به حساب می‌آید. طبق آزمایش‌های انجام شده در این تحقیق، با استفاده از قوانین انجمنیمی‌توان دقت برچسب‌گذاری کلمات ناشناخته فارسی را به 81.2% افزایش داد. این در حالی است که میزان دقت کلی و سرجمع برچسب گذار ارائه شده برابر با 98% است.
کلیدواژه‌ها
برچسب‌گذاری ادات سخن، مدل مخفی مارکف، کلمات ناشناخته، قوانین انجمنی
0 0 رای ها
رأی دهی
اشتراک در
اطلاع از
guest
0 نظر
بازخورد (Feedback) های اینلاین
نمایش همه نظرات