پروژه‌ها

استخراج رویداد​

استخراج رویداد یکی از مهم‌ترین و چالش‌برانگیزترین وظیفه‌های استخراج اطلاعات است؛ که به عنوان زیربنایی برای بسیاری از کاربردهای پردازش زبان طبیعی مانند جستجوی معنایی اطلاعات، خلاصه سازی متون و غیره به شمار می‌رود. استخراج رویداد به تشخیص و استخراج رویدادهای مهم مانند رویداد مرگ، تولد، درگیری و دیگر موارد در متونی با زبان طبیعی می‎پردازد. استخراج رویداد از دو مرحله‎ی کلی استخراج حوزه‎ی رویداد و استخراج اطلاعات و یا عوامل درگیر در رویداد تشکیل شده است. در این پروژه به استخراج رویداد و اطلاعات مربوط به آن در متون اسلامی تاریخی عربی پرداخته شده است؛ که دارای ساختار زبان شناسی پیچیده و متفاوت نسبت به متون متداول امروزی است و می‎تواند ابزاری بسیار مفید برای محققین در این حوزه باشد.

تشخیص درست حوزه ی رویداد و تعیین جملاتی که رویداد را توصیف می کنند به عنوان اولین و

مؤثرترین گام، صحت فرایند استخراج اطلاعات رویداد را تحت تأثیر قرار می دهد.

استخراج رویداد

عناصر شرکت کننده در رویداد می توانند افراد و یا سازمان ها، تاریخ، زمان، مکان و دیگر اطلاعات مرتبط با آن رویداد باشد.

نمونه ای از شناسایی هوشمند رویدادهای تاریخی خاص مثل رویداد مرگ

اسخراج رویداد - کد

در این سیستم با مسئله ی تعیین جملات شامل رویداد به صورت یک مسئله ی رده بندی متن به صورت دودویی رفتار شده است که به هر یک از نمونه های متن جمله ی « )جملات( یکی از کلاس های On-Event جمله ی « یا » Off-Event را نسبت می دهد. » جمله ی « یک جمله به صورت On-Event برچسب می » خورد، در صورتی که شامل یک یا چند جمله ی « نمونه از نوع رویداد مورد نظر باشد؛ و یک جمله در صورتی به عنوان Off-Event » برچسب می خورد که شامل هیچ نمونه ای از نوع رویداد مورد نظر نباشد.

استخراج رویداد - نمودار

به عنوان کارهای تحقیقاتی پیش رو می توان با افزودن صفات بیشتر، تأثیر آن ها را بر کارایی و نتیجه ی رده بند چکانه ی رویداد مبتنی بر ماشین بردار پشتیبان مشاهده نمود و هم چنین روشی برای خودکارسازی انتخاب صفات تأثیر گذار و تعداد آن ها نیز پیشنهاد داد. برای بهبود روش مبتنی بر زنجیره ی لغوی نیز می توان علاوه بر تعداد کلمات مشترک بین جمله ی مورد پردازش و زنجیره ی لغوی عوامل دیگری را نیز در انتخاب جمله به عنوان جمله ی شامل رویداد دخیل دانست. این عوامل می تواند توجه به زمان و نوع کلمه و امثال آن، در اسناد آموزش و اعمال آن به عنوان یک عنصر تأثیر گذار در فرایند آزمون باشد.

از سوی دیگر برای استخراج آرگومان های رویداد می توان سیستم را به گونه ای توسعه داد که با بهره گیری از سیستم های ایجاد قانون به تولید قوانین استخراج با استفاده از یک مجموعه قوانین اولیه پرداخت،. در این صورت نیاز به یک مدیر دانش برای ایجاد مجموعه ی بزرگی از قوانین کم تر خواهد شد.

0 0 رای ها
رأی دهی
اشتراک در
اطلاع از
guest
0 نظر
بازخورد (Feedback) های اینلاین
نمایش همه نظرات