مقالات​

برچسب‌گذاری ادات سخن متون فارسی به کمک مدل مخفی مارکوف

نویسندگان
الهی منش ، محمدحسین ؛ مینایی​ ، بهروز
چکیده
در این مستند، به یکی از دغدغه های بزرگ در زمینه زبان شناسی محاسباتی(۱) با نام برچسب گذاری ادات سخن (part of speech tagging) پرداخته شده است. برچسب گذاری ادات سخن که یکی از پایه ای ترین نیازهای پردازش هوشمند متن به شمار می آید، وابسته به زبان متن مورد پردازش است. از این رو، فراهم شدن برچسب گذاری قوی برای زبان فارسی، جزو اولویتهای کار ما قرار گرفت. تکنیک مورد کاربرد ما برای حل این مساله، استفاده ازمدل مخفی مارکوف(۲) بوده است. این تکنیک در بسیاری از شیوه های برچسب گذاری به کاربرده می شود؛ برای نمونه، در برچسب گذار TNT[۲] که یکی از قوی ترین برچسب گذارها در زبان های مختلف است[۴، ۵، ۸]. طبق آزمایش های انجام شده ما، با استفاده از این برچسب گذار می توان با دقت ۹۴.۳% برچسب گونه صرفی کلمات فارسی را مشخص نمود.
کلیدواژه‌ها
0 0 رای ها
رأی دهی
اشتراک در
اطلاع از
guest
0 نظر
بازخورد (Feedback) های اینلاین
نمایش همه نظرات