طريقة جديدة لتمييز النصوص التي كتبها الذكاء الاصطناعي
دراسة حديثة من جامعة نورث وسترن وجامعة توبنغن تكشف عن إمكانية تحديد النصوص المكتوبة بواسطة الذكاء الاصطناعي بطريقة سهلة وبسيطة
هل كان الذكاءُ الاصطناعيُّ وراءَ تلكَ الرسالةِ الإلكترونيَّةِ التي وصلتكَ؟ هل كتبَ ChatGPT المذكرةَ الجديدةَ لمكتبكَ؟
الإجابةُ على أسئلةٍ جديدةٍ مثلَ هذهِ قد تكونُ معقدةً، ولكنْ دراسةٌ جديدةٌ أجراها باحثونَ من جامعةِ نورث وسترن (Northwestern University) وجامعةِ توبنغن الألمانيةِ (University of Tübingen) تقترحُ إمكانيةَ التمييزِ بينَ النصوصِ التي يولدها الذكاءُ الاصطناعيُّ، وتلكَ التي يكتبها الإنسانُ.
مع تطورِ وانتشارِ النماذجِ اللغويةِ الكبيرةِ (LLMs)، والتي تقفُ خلفَ تطبيقاتٍ مثلَ ChatGPT وGemini من غوغل، شهدتْ عمليةُ توليدِ النصوصِ بواسطةِ الذكاءِ الاصطناعيِّ ازدهاراً ملحوظاً. وفقاً لدراسةٍ أجرتها Slack، فإنَّ واحداً من كلِّ أربعةِ موظفينَ في المكاتبِ قد جربَ استخدامَ الذكاءِ الاصطناعيِّ في العملِ.
في هذا السياقِ، نشرَ باحثونَ بحثاً علمياً جديداً على مستودعِ الأبحاثِ المسبقةِ arXiv بعنوانِ "التحليلِ الدقيقِ لاستخدامِ ChatGPT في الكتابةِ الأكاديميةِ من خلالِ الكلماتِ الزائدةِ". يقدمُ البحثُ طريقةً لتمييزِ النصوصِ التي ينتجها الذكاءُ الاصطناعيُّ عن تلكَ التي يكتبها الإنسانُ.
قامَ الباحثونَ بدراسةِ التغييراتِ في المفرداتِ عبرَ 14 مليونَ ملخصٍ لمقالاتٍ أكاديميةٍ نُشرتْ بينَ عامي 2010 و2024. وأظهرتْ النتائجُ أنَّ ظهورَ النماذجِ اللغويةِ الكبيرةِ "أدى إلى زيادةٍ مفاجئةٍ في تكرارِ بعضِ الكلماتِ النمطيةِ". وكتبَ الباحثونَ: "تحليلُنا استناداً إلى استخدامِ الكلماتِ الزائدةِ يشيرُ إلى أنَّ ما لا يقلُّ عن 10% من ملخصاتِ 2024 تمَّتْ معالجتها بواسطةِ النماذجِ اللغويةِ الكبيرةِ".
التغييراتُ اللغويةُ التي تبعتْ انتشارَ برامجِ الذكاءِ الاصطناعيِّ كانتْ غيرَ مسبوقةٍ من حيثِ الجودةِ والكميةِ، كما جاءَ في المقالةِ التي نُشرتْ في منتصفِ يونيو.
إذًا، ما هيَ الكلماتُ التي بدا أنَّ الذكاءَ الاصطناعيَّ يفرطُ في استخدامها؟ وجدَ الباحثونَ أنَّ بعضَ المصطلحاتِ مثلَ "يتعمّقُ" (delves)، "يبرزُ" (showcasing)، "يؤكدُ" (underscores)، "إمكانيةُ" (potential)، "نتائجُ" (findings)، و"حاسمةُ" (crucial) اُستخدمتْ بشكلٍ زائدٍ في الأوراقِ الأكاديميةِ لعامِ 2024، بالإضافةِ إلى حوالي 300 كلمةٍ أخرى أصبحتْ فجأةً أكثرَ شيوعاً.
بطبيعةِ الحالِ، هناكَ أسبابٌ أخرى قد تفسرُ انتشارَ هذهِ الكلماتِ في السنواتِ الأخيرةِ. لكنّ الباحثينَ لاحظوا أنَّهُ في الماضي، كانتِ الكلماتُ التي شهدتْ زيادةً مفاجئةً في الاستخدامِ عادةً أسماءً لمحتوى محددٍ مثلَ "إيبولا" (ebola) في 2015 و"زيكا" (zika) في 2017، وكذلكَ "فيروسُ كورونا" (coronavirus)، "إغلاقُ" (lockdown)، و"جائحةُ" (pandemic) بينَ 2020 و2022، بدلاً من الكلماتِ النمطيةِ مثلَ الصفاتِ والأفعالِ التي زادتْ في الاستخدامِ بعدَ انتشارِ الذكاءِ الاصطناعيِّ.
كما تقولُ المقالةُ: "الزيادةُ غيرُ المسبوقةِ في الكلماتِ النمطيةِ الزائدةِ في عامِ 2024 تسمحُ لنا باستخدامِها كعلاماتٍ لاستخدامِ ChatGPT".
بالطبعِ، اللغةُ التي قد يستخدمها الذكاءُ الاصطناعيُّ في سياقِ العملِ قد تختلفُ عن تلكَ التي يستخدمها عندَ كتابةِ ملخصٍ لمقالةٍ أكاديميةٍ. ومعَ ذلكَ، من الجديرِ بالذكرِ أنَّه يبدو أنّ الذكاءَ الاصطناعيَّ يتركُ خلفهُ آثاراً واضحةً في اختيارهِ للكلماتِ، ما يشيرُ إليهِ الباحثونَ بـ"بصماتِ" البرمجياتِ.