استخراج رویداد یکی از مهمترین و چالشبرانگیزترین وظیفههای استخراج اطلاعات است؛ که به عنوان زیربنایی برای بسیاری از کاربردهای پردازش زبان طبیعی مانند جستجوی معنایی اطلاعات، خلاصه سازی متون و غیره به شمار میرود. استخراج رویداد به تشخیص و استخراج رویدادهای مهم مانند رویداد مرگ، تولد، درگیری و دیگر موارد در متونی با زبان طبیعی میپردازد. استخراج رویداد از دو مرحلهی کلی استخراج حوزهی رویداد و استخراج اطلاعات و یا عوامل درگیر در رویداد تشکیل شده است. در این پروژه به استخراج رویداد و اطلاعات مربوط به آن در متون اسلامی تاریخی عربی پرداخته شده است؛ که دارای ساختار زبان شناسی پیچیده و متفاوت نسبت به متون متداول امروزی است و میتواند ابزاری بسیار مفید برای محققین در این حوزه باشد.
تشخیص درست حوزه ی رویداد و تعیین جملاتی که رویداد را توصیف می کنند به عنوان اولین و
مؤثرترین گام، صحت فرایند استخراج اطلاعات رویداد را تحت تأثیر قرار می دهد.
عناصر شرکت کننده در رویداد می توانند افراد و یا سازمان ها، تاریخ، زمان، مکان و دیگر اطلاعات مرتبط با آن رویداد باشد.
نمونه ای از شناسایی هوشمند رویدادهای تاریخی خاص مثل رویداد مرگ
در این سیستم با مسئله ی تعیین جملات شامل رویداد به صورت یک مسئله ی رده بندی متن به صورت دودویی رفتار شده است که به هر یک از نمونه های متن جمله ی « )جملات( یکی از کلاس های On-Event جمله ی « یا » Off-Event را نسبت می دهد. » جمله ی « یک جمله به صورت On-Event برچسب می » خورد، در صورتی که شامل یک یا چند جمله ی « نمونه از نوع رویداد مورد نظر باشد؛ و یک جمله در صورتی به عنوان Off-Event » برچسب می خورد که شامل هیچ نمونه ای از نوع رویداد مورد نظر نباشد.
به عنوان کارهای تحقیقاتی پیش رو می توان با افزودن صفات بیشتر، تأثیر آن ها را بر کارایی و نتیجه ی رده بند چکانه ی رویداد مبتنی بر ماشین بردار پشتیبان مشاهده نمود و هم چنین روشی برای خودکارسازی انتخاب صفات تأثیر گذار و تعداد آن ها نیز پیشنهاد داد. برای بهبود روش مبتنی بر زنجیره ی لغوی نیز می توان علاوه بر تعداد کلمات مشترک بین جمله ی مورد پردازش و زنجیره ی لغوی عوامل دیگری را نیز در انتخاب جمله به عنوان جمله ی شامل رویداد دخیل دانست. این عوامل می تواند توجه به زمان و نوع کلمه و امثال آن، در اسناد آموزش و اعمال آن به عنوان یک عنصر تأثیر گذار در فرایند آزمون باشد.
از سوی دیگر برای استخراج آرگومان های رویداد می توان سیستم را به گونه ای توسعه داد که با بهره گیری از سیستم های ایجاد قانون به تولید قوانین استخراج با استفاده از یک مجموعه قوانین اولیه پرداخت،. در این صورت نیاز به یک مدیر دانش برای ایجاد مجموعه ی بزرگی از قوانین کم تر خواهد شد.
تأسیس آزمایشگاه هوش مصنوعی و علوم اسلامی و انسانی دیجیتال با تأکید بر نگاه برونسازمانی، گام جدیدی برای همافزایی حداکثری با دانشگاهها، پژوهشگاهها و افراد فعال در حوزه پردازش هوشمند محتوای اسلامی است.
قم – بلوار امین – خیابان جمهوری اسلامی – ساختمان مرکز تحقیقات کامپیوتری علوم اسلامی
صندوق پستی 3857 – 37185
تلفن : 32120212 – 025
دورنگار: 32936294 – 025
رایانامه: info [at] ai.inoor.ir