سرقت ادبی توسط ChatGPT: بررسی پاسخها و کدهای تولید شده
در دنیای دیجیتال امروز، چتباتها و مدلهای زبانی پیشرفته همچون ChatGPT به ابزارهای قدرتمندی تبدیل شدهاند که میتوانند به سوالات ما پاسخ دهند، کد بنویسند و حتی محتوای متنی تولید کنند. اما آیا تا به حال به این فکر کردهاید که آیا این ابزارهای هوش مصنوعی ممکن است محتوای تولید شده خود را از منابع دیگر بهطور غیرمجاز کپی کنند؟
در این مقاله، ما به بررسی این موضوع پرداختهایم که آیا ChatGPT واقعاً بهطور مستقیم از منابع آنلاین محتوای خود را استخراج میکند یا خیر.
فهرست مطالب
با استفاده از ابزارهای مختلف تشخیص سرقت ادبی و آزمایشهای دقیق، به بررسی اصالت مقالات، کدها و حتی راهحلهای ریاضی تولید شده توسط این چتبات پرداختهایم. آیا ChatGPT در واقع خلاقانه عمل میکند و محتوای تازهای تولید میکند، یا ممکن است بدون اینکه ما متوجه شویم، به منابع موجود در اینترنت تکیه کند؟
در ادامه، نتایج آزمایشهای ما را بررسی خواهیم کرد و به شما خواهیم گفت که آیا باید در استفاده از ChatGPT برای اهداف تحصیلی و حرفهای خود تجدید نظر کنید یا خیر.
سرقت ادبی چیست و مدلهای زبانی بزرگ (LLM) چگونه کار میکنند؟
برای اینکه بتوانید تشخیص دهید آیا ChatGPT مرتکب سرقت ادبی شده است یا نه، ابتدا باید بدانید سرقت ادبی چیست. سرقت ادبی به استفاده از کلمات، ایدهها یا آثار شخص دیگری بدون ذکر منبع مناسب گفته میشود. این شامل کپی کردن مستقیم متن از منبع بدون ارجاع یا بازنویسی نزدیک به ایدههای دیگران بدون ذکر منبع است.
ChatGPT، مانند دیگر مدلهای زبانی بزرگ (LLM)، با استفاده از مجموعههای داده بزرگ، عمدتاً از محتوای عمومی، آموزش دیده است. اما جمعآوری این حجم وسیع از دادهها سوالات اخلاقی را مطرح میکند، زیرا خالقان اصلی این محتوا رضایتی برای استفاده از آثارشان در آموزش مدلهای زبانی ندادهاند. این موضوع باعث به وجود آمدن بحثهایی درباره اخلاق و قانونی بودن اینگونه اقدامات میشود.
اگرچه ChatGPT پاسخهای خود را بر اساس دستورات دریافتی تولید میکند، مشکل اصلی در چگونگی جمعآوری دادههایی است که OpenAI (توسعهدهنده ChatGPT) برای آموزش این مدل به کار برده است؛ این دادهها شامل استفاده از محتوایی است که بدون رضایت مناسب گردآوری شدهاند. بسیاری این عمل را نوعی سرقت ادبی یا حتی دزدی محتوا از وبسایتها میدانند. اما تعیین دقیق منابعی که سرقت ادبی از آنها صورت گرفته، کار دشواری است.
در ادامه این مقاله، تمرکز ما بر این خواهد بود که آیا ChatGPT پاسخهای خود را بدون اجازه از منابع دیگر کپی میکند یا خیر، بدون اینکه وارد جزئیات مربوط به منابع دقیق پاسخهای آن شویم. برای بررسی اصالت پاسخهای ChatGPT، از ابزارهای مختلف تشخیص سرقت ادبی استفاده میکنیم تا ببینیم آیا این چتبات متنهای خود را مستقیماً از منابع آنلاین کپی میکند یا خیر.
آیا ChatGPT مقالات را سرقت ادبی میکند؟
در این مثال اول، از ChatGPT خواستیم یک مقاله ۳۰۰ کلمهای در مورد مشکلات مربوط به سلامت روان بنویسد.
سپس از ابزارهای مختلف تشخیص سرقت ادبی برای ارزیابی اصالت مقاله تولید شده توسط ChatGPT استفاده کردیم. این ابزارها شامل Quetext، ابزار تشخیص سرقت ادبی داخلی Microsoft Word، تشخیص سرقت ادبی Grammarly، و اسکنر سرقت ادبی Duplichecker بودند.
ابزار داخلی بررسی شباهت مایکروسافت هیچگونه شباهتی با منابع آنلاین نشان نداد و درصد سرقت ادبی را صفر گزارش کرد. سطوح سرقت ادبی تشخیص داده شده توسط سایر ابزارها نیز ناچیز بودند: ابزار تشخیص سرقت ادبی Grammarly چهار درصد، Quetext پنج درصد، و Duplichecker صفر درصد را گزارش کردند.
با توجه به درصد بسیار کم سرقت ادبی شناسایی شده، به نظر میرسد ChatGPT مقالات را مستقیماً از منابع موجود کپی نمیکند.
آیا ChatGPT کدها را سرقت ادبی میکند؟
برای ارزیابی اینکه آیا ChatGPT در تولید کدها نیز سرقت ادبی میکند، از این چتبات خواستیم که کدی برای یک ماشینحساب به زبان پایتون بنویسد.
سپس کد تولید شده را با استفاده از یک ابزار تخصصی تشخیص سرقت ادبی در برنامهنویسی به نام Dolos بررسی کردیم که هیچ شباهتی (صفر درصد) را تشخیص نداد. همچنین زمانی که کد را با استفاده از ابزارهای عمومی تشخیص سرقت ادبی که قبلاً اشاره شد بررسی کردیم، نتایج مشابهی به دست آمد و تقریباً هیچکدام از این ابزارها بیش از چهار درصد سرقت ادبی را نشان ندادند.
زمانی که از حسابهای مختلف خواستیم که ChatGPT کدی برای ماشینحساب تولید کند، پاسخها متفاوت به نظر میرسیدند. این مشاهدات و نتایج بررسیهای سرقت ادبی نشان میدهند که ChatGPT صرفاً کدها را از منابع آنلاین کپی نمیکند؛ بلکه بر اساس دادههای آموزشی خود بهطور مستقل کد تولید میکند.
آیا ChatGPT راهحلهای ریاضی را سرقت ادبی میکند؟
در سومین آزمایش، از این چتبات خواستیم یک مسئله ریاضی را حل کند و برای هر مرحله از حل، توضیحات دقیقی ارائه دهد.
برای بررسی اصالت پاسخ، خروجی ChatGPT را با استفاده از چندین ابزار تخصصی تشخیص سرقت ادبی در زمینه آکادمیک، از جمله PapersOwl و اسکنر سرقت ادبی Trinka، و همچنین ابزارهای عمومی مانند Grammarly، Duplichecker و QueText آزمایش کردیم.
ابزار تشخیص سرقت ادبی PapersOwl نشان داد که تقریباً ۴۶ درصد از توضیحات تولید شده توسط چتبات با منابع آنلاین مشابه است. همچنین، اسکنر Trinka بیش از ۱۰ درصد شباهت را گزارش کرد. علاوه بر این، ابزار Grammarly شباهت ۱۴ درصدی، QueText شباهت ۱۷ درصدی و Duplichecker شباهت ۷ درصدی را شناسایی کردند.
تشخیص درصد بالای سرقت ادبی در پاسخهای تولید شده توسط چتبات به این معنی نیست که ChatGPT مستقیماً توضیحات برای مسائل ریاضی را از منابع آنلاین کپی میکند. این موضوع بیشتر به این دلیل است که راهحلها و توضیحات مسائل ریاضی معمولاً استاندارد هستند و بهطور گستردهای در اینترنت در دسترساند
بنابراین، حتی اگر ChatGPT پاسخهای خود را بهصورت مستقل ارائه دهد، یافتن پاسخها و توضیحات مشابه بهصورت آنلاین امکانپذیر است که میتواند به افزایش درصد سرقت ادبی منجر شود.
آیا ChatGPT از محتوای وبلاگها استفاده میکند؟
برای بررسی اینکه آیا ChatGPT از محتوای وبلاگهای آنلاین استفاده میکند یا نه، از آن خواستیم نکاتی برای حفظ سلامت باتری لپتاپ ارائه دهد.
ابزار Microsoft Word ده درصد سرقت ادبی در متن تولید شده تشخیص داد. Duplichecker چهار درصد، ابزار تشخیص سرقت ادبی Grammarly چهارده درصد، و Quetext پنجاه و هشت درصد سرقت ادبی را گزارش کردند. با بررسی بیشتر، مشخص شد که برخی از جملات در پاسخ چتبات با محتوای چندین وبلاگ آنلاین همخوانی داشت.
برای اطمینان از اینکه این میزان بالای سرقت ادبی تصادفی نبوده است، چند سؤال دیگر از چتبات در مورد اطلاعاتی که بهراحتی در اینترنت قابل دسترسی هستند پرسیدیم. درصد سرقت ادبی در پاسخهای تولید شده بهطور قابل توجهی بالاتر بود. بر اساس آزمایشهای ما، به نظر میرسد که چتبات گاهی از عبارات و متنهای موجود در منابع آنلاین استفاده میکند، که این موضوع کمی شگفتانگیز است.
آیا می توان از ChatGPT برای کار یا مدرسه استفاده کنید؟
با اینکه بسیاری از ابزارهای رایگان تشخیص سرقت ادبی آنلاین، سرقت ادبی عمدهای را در پاسخهای ChatGPT تشخیص ندادهاند، اما بهتر است از آن برای اهداف تحصیلی یا حرفهای استفاده نکنید.
اگر دانشجو هستید، برای انجام تکالیف مدرسه از ChatGPT استفاده نکنید. اساتید میتوانند از ابزارهایی مانند GPTZero و تشخیصدهنده محتوای تولید شده توسط AI در Turnitin برای شناسایی محتوای تولید شده توسط هوش مصنوعی استفاده کنند. اگر کار شما توسط این ابزارها بهعنوان محتوای تولید شده توسط هوش مصنوعی علامتگذاری شود، ممکن است در آن تکلیف رد شوید یا حتی از مدرسه تذکر بگیرید.
حتی اگر بسیاری از ابزارهای تشخیص محتوای GPT مشخصاً بیان کردهاند که نباید برای این منظور استفاده شوند، همچنان از آنها استفاده میشود و ممکن است برای شما دردسرساز شود. به علاوه، با عدم مطالعه درست موضوع، در واقع دارید به خودتان خیانت میکنید.
آیا میتوانید برای بهبود عملکرد کاری خود از این چتبات استفاده کنید؟ بستگی دارد. اگر میخواهید جریان نوشتاری خود را در ایمیلها یا سایر فرمهای متنی بهبود ببخشید، استفاده از هوش مصنوعی میتواند در وقت و انرژی شما صرفهجویی کند. با این حال، باید فقط بهعنوان یک ابزار کمکی از آن استفاده کنید و نه اینکه تمام کار را به آن بسپارید.
از سوی دیگر، اگر شغلتان، مانند نویسندگی حرفهای، استفاده از چنین ابزارهایی را ممنوع میکند، باید از استفاده ChatGPT یا هر ابزار دیگری خودداری کنید.
نتیجه گیری
امیدواریم آزمایشهای ما به شما دیدی نسبت به این موضوع داده باشد که ChatGPT تا چه حد ممکن است از منابع موجود در وب استفاده کند. با این حال، باید توجه داشت که ما از ابزارهای رایگان تشخیص سرقت ادبی استفاده کردهایم و تنها یک مجموعه داده محدود را بررسی کردهایم. بنابراین، اگرچه یافتههای ما میتواند مفید باشد، نباید آنها را بهعنوان حقایق مطلق در نظر گرفت.