OpenAI تُطلق وضع الصوت المتقدم بعد جدل سكارليت جوهانسون
بدأ طرح وضع الصوت المتقدم لنموذج GPT-4o لمشتركي ChatGPT Plus، مع تحسينات كبيرة بعد الجدل حول تشابه صوت "سكاي" مع صوت الممثلة
أعلنت شركة OpenAI عن بدءِ طرحِ وضعِ الصوتِ المتقدِّمِ الذي طال انتظاره. يتيحُ هذا الوضعُ للمستخدمين التّفاعلَ عبرَ محادثاتٍ صوتيةٍ تشبهُ المحادثاتِ البشريةَ مع مساعدِ AI الذي يعتمدُ على نموذجِ GPT-4، وهو النّموذجُ الأكثرُ تقدُّماً للشّركة. سيتمُّ طرحُ الوضعِ الجديدِ تدريجيّاً لمشتركي ChatGPT Plus المدفوعين خلالَ الأشهرِ القليلةِ المقبلة.
كشفت الشركةُ التي يقودُها سام ألتمان (Sam Altman) عن وضعِ الصوتِ الجديدِ لأولِ مرةٍ في مايو خلالَ مؤتمرٍ صحفيٍّ، ولكن الكثيرَ من النقاشاتِ التي تلت الحدثَ ركزت على التشابهِ الكبيرِ بين صوتِ إحدى الخياراتِ الصوتيةِ، والتي تُدعى "سكاي"، وصوتِ الممثلةِ سكارليت جوهانسون (Scarlett Johansson). بعد أيامٍ، كشفت جوهانسون أن ألتمان قد طلبَ منها أن تكون "صوتَ" ChatGPT، لكنها رفضت. وبعدَ رؤيةِ فيديو لعملِ "سكاي"، هددت جوهانسون باتخاذِ إجراءاتٍ قانونيةٍ، وبالرغم من أن OpenAI أكّدت أنّ التّشابهَ كان محضَ صدفةٍ، إلّا أنّها وافقت على إلغاءِ هذا الخيارِ الصوتي.
صرّح متحدثٌ باسم OpenAI لمجلةِ .Inc بأنّ منذ العرضِ التّقديميِّ في مايو، ركّزت الشركةُ بشكلٍ مكثّفٍ على تحسينِ أمانِ وضعِ الصّوتِ، وجعلت من المستحيلِ على ChatGPT انتحالَ أصواتِ الآخرين، سواءً كانوا أفراداً أو شخصياتٍ عامّةً. كما لن يكون الوضعُ الصّوتيُّ قادراً على إنتاجِ الموسيقى أو أيّ محتوىً صوتيٍّ محميٍّ بحقوق الطبع والنّشر. لذلك، إذا كنت تأملُ في استخدامِ ChatGPT لإنشاءِ مقطعٍ صوتيٍّ لجو بايدن يغني "Espresso"، فاستعدَّ للشّعورِ بخيبةِ الأمل.
ستشارك OpenAI تقريراً مفصّلاً في أوائلِ أغسطس حول العملِ الأخيرِ الذي تمَّ القيامُ به لتحسينِ وضعِ الصّوت. في النّسخةِ الحاليةِ من وضعِ الصّوتِ، يختار المستخدمون من بينِ قائمةٍ تحتوي على أربعةِ أصواتٍ، ولكن يتعيّن عليهم الانتظارُ للحصولِ على ردٍ بعد كل إدخالٍ. النّسخةُ الجديدةُ، التي عرضتها OpenAI مؤخّراً والتي يتمُّ طرحها الآن، تستخدمُ نفسَ الأصواتِ، ولكنّها أسرعُ بشكلٍ كبيرٍ، وتبدو أكثرَ طبيعيةً.