پروژه‌ها

تقلب یابی متون​

دست‌برد فکری (plagiarism)، عبارت است از قلمداد کردن ایده‌ها، جملات یا اثر شخص دیگر، به مثابه ایده، جمله یا اثر خود. این کار، شکلی از فریب‌کاری و  خیانت در امانت علمی است. (Ballard, 2010, p. 1) باز استفاده از متن، عبارت از استفاده عمدی یا غیر عمدی از متن موجود برای ایجاد یک متن جدید است که اگر در این باز استفاده، مستند‌سازی به‌درستی صورت نگیرد، دست‌برد فکری رخ خواهد داد. مؤسسات آموزشی و صنعتی، اغلب با دست‌برد فکری و نقض حق نشر مواجه‌اند. چنان‌که گفته شد، دست‌برد فکری، عرضه و نمایش ایده‌ها یا اثر یک شخص از سوی شخص دیگر به مثابه اثر و ایده خود است. این عرضه، ممکن است در شکل یک متن صریح، آن گونه که در مقالات و گزارش‌ها دیده می‌شود باشد، یا در یک متن ساختار یافته، مانند معادلات و برنامه‌نویسی رایانه‌ای رخ دهد.

حق نشر، حق چاپ انحصاری برای ناشران برای محافظت ایده‌ها و اطلاعات به دست می‌دهد. مؤلفان ممکن است استفاده رایگان از آثار تحت حق نشر خود را مجاز کنند؛ اما باز تولید نامجاز دیگران، به مثابه نقض حق نشر به شمار می‌رود و هرگز نمی‌توان آن را مجاز شمرد. (Burrows & Tahaghoghi, 2007)

شکل‌های دست‌برد فکری

دست‌برد فکری به شکل رونوشت مستقیم

دست‌برد فکری به عنوان رونوشت قسمتی از یک اثر

دست‌برد فکری تفسیری/ تعبیری (Paraphrase plagiarism)

سرقت فکری موزاییکی (Mosaic plagiarism)

دست‌برد فکری به منبع (Source plagiarism)

دست‌برد فکری به منزله استناد ناکامل (Incomplete-citation plagiarism)

دست‌برد فکری عبارت (Phrase Plagiarism)

دست‌برد به ایده ها (Idea Plagiarism)

 

شیوه های تشخیص خودکار دست‏برد فکری

اِسناد تألیف (Authorship attribution) یا شناسایی تألیف (Authorship identification)، فرایند تعیین این امر است که چه کسی از میان نویسندگان محتمل، یک متن را نوشته است.

از جمله شیوه هایی که برای تشخیص نویسنده می‏توان استفاده کرد، سبک‏سنجی است. سبک‏سنجی، ویژگی‏هایی از سبک یک نویسنده را تعریف می‌کند و این ویژگی‏ها را در دو یا چند متن اندازه می‏گیرد تا مشابهت میان این دو متن را تعیین نماید. بر این اساس، می‏توان گفت شبیه‏ترین سبک، یعنی دو متن که بیشترین شبهات را از دید سبک به هم دارند، توسط یک مؤلف نوشته شده‏اند. این ایده که سبک در یک سطح ناخودآگاه عمل می‏کند، آن را بهتر قابل اندازه‏گیری می‏سازد. در واقع، می‏توان گفت که سبک نوشتار، به منزله یک اثر انگشت است.

رهیافت‌های تشخیص خودکار دست‌برد فکری

انگشت‌نگاری (Fingerprinting)

تطبیق رشته (String matching)

کیف واژگان (Bag of words)

تحلیل استنادی (Citation analysis)

سبک‌سنجی (Stylometry)

تقلب یابی متون

سمیم نور(3) ابزاری ماشینی برای تشخیص دست‌برد فکری

یکی از راه های پی بردن به آثاری که در آن‌ها دست‏برد فکری صورت گرفته است، استفاده از پایگاه «سمیم نور» مرکز تحقیقات کامپیوتری علوم اسلامی است. این پایگاه که بر پایه شیوه های یادگیری ماشینی به یافتن متون مشابه اقدام می‏کند، از بانک اطلاعات پایگاه مجلات تخصصی نور (4) برای مقایسه مشابهت میان مقالات عرضه‌شده کاربر بهره می‏برد که در آینده از منابع پایگاه کتابخانه دیجیتال نور (5) و نیز کتاب‌هایی که در بخش خدمات فرهنگی این مرکز و با همکاری تولیدکنندگان محتوا تبدیل به نرم‌افزارهای نور شده، در بانک دادگان پایگاه استفاده خواهد شد. شاید نقطه قوت مرکز تحقیقات کامپیوتری علوم اسلامی نور در انجام این کار، دارا‌بودن انبوهی از متون  و واژگان ماشین‌خوان در حوزه علوم انسانی و اسلامی است. این پشتوانه، ابزارها و مواد اولیه بسیار مناسبی در یادگیری ماشینی و نیز نمونه‌های غنی برای تطبیق و مشابهت به دست می‌دهد.

تقلب یابی متون

0 0 رای ها
رأی دهی
اشتراک در
اطلاع از
guest
0 نظر
بازخورد (Feedback) های اینلاین
نمایش همه نظرات