بعد ما يقرب من عامين على إطلاق تقنية “تشات جي بي تي” من شركة “أوبن إيه آي”، واجهت أول لحظة أشعر فيها حقيقة بالدهشة والانبهار من جنون الذكاء الاصطناعي.
طبعاً، شعرت بالإعجاب لكيفية قدرة روبوتات الدردشة على إنتاج ردود مفيدة وتوليف المعلومات. وسليت نفسي ببعض الصور التي أنشأتها باستخدام تطبيقات مختلفة. ولكنني في أغلب الأحوال تعاملت مع الذكاء الاصطناعي بدرجة صحية من التشكك، وغالباً ما رأيت ضجيجاً بلا طحين، وما زلت أجد ذلك بوضوح صارخ عندما أتفاعل مع كمبيوتر وليس مع إنسان.
تغير الكثير من ذلك عندما أمضيت الأسبوع الماضي في تجريب تحديث خاصية الصوت المتقدمة في “تشات جي بي تي”.
بدأ طرح هذه الخدمة الأسبوع الماضي لأصحاب الاشتراكات المدفوعة، بعد تأخرها في البداية بسبب مشكلات محتملة تتعلق بالسلامة والأمان. وقالت “أوبن إيه آي” هذا الأسبوع إنها ستطلق مساعدها الصوتي للشركات والمطورين لاستخدامه في تطبيقاتهم الخاصة.
هذه الأداة الأسطورية التي تستطيع التحدث بخمسين لغة بدقة تشبه البشر، لديها القدرة على تغيير كيفية تفاعل الناس حول العالم مع الذكاء الاصطناعي إلى الأبد. كما أنها تدشن عصراً جديداً من الشك والغموض في سوق العمل العالمي.
إتقان اللغات والفوارق الثقافية
كان أكثر إنجاز واجهته إثارة للدهشة والذهول هو مدى إتقان هذه الأداة للفروق الثقافية الدقيقة واللغات غير الإنجليزية.
إن برامج الترجمة المختلفة موجودة منذ فترة، لكن كثيراً منها لم تزل تعاني في ترجمة اللغة الإنجليزية إلى اللغات الآسيوية مقارنة مع اللغات الأوروبية. وقد دخلت عليها تحسينات على مر السنين، خاصة في ترجمة النصوص المكتوبة. ولكن خاصية الصوت المتقدمة في “تشات جي بي تي” تستطيع الانتقال بسلاسة بين اللغات بردود حية تشبه ردود الإنسان وأخطاء ضئيلة في أقل الحدود.
أجريت محادثات معه باللغة اليابانية، واستخدمته في التدريب على الكيغو، وهو الصيغة الأكثر رسمية وتعقيداً من اللغة اليابانية وتستخدم في المناسبات الرسمية والتجارية. بل إنه اجتاز حتى اختباري المعتاد لبرامج الترجمة الآلية اليابانية، حيث أدرك أن إشارة المرور تومض بلون “آو” (ao)، أو أزرق، وليس أخضر.
لترى ذلك بنفسك، عليك مشاهدة مقطع فيديو حصد ما يقرب من 5 ملايين مشاهدة على منصة “إكس”، المعروفة سابقاً باسم “تويتر”، يظهر “تشات جي بي تي” وهو يروي حكاية أطفال يابانية ويغير صوته إلى صوت معلق رياضي عندما يؤمر بذلك.
عندما طلبت من “تشات جي بي تي” مساعدتي في تعلم لغة “الماندرين”، قدم لي ملاحظات مفصلة حول نبرات صوتي. ولاحظ أحد محللي الصين أن استخدامه لممارسة التحدث باللغة الصينية “ليس أقل من مذهلٍ”.
لحظة الدهشة الحقيقية
جاءت لحظة الدهشة الحقيقية عندما طلبت منه التحدث معي بلهجة “بيدجين” في هاواي، وهي لغة “الكريول” التي ظهرت في مزارع قصب السكر في الجزر في ثلاثينيات القرن التاسع عشر، ولم أسمعها منذ وفاة جدي وجدتي قبل ما يقرب من 10 سنوات.
كانت قدرة “تشات جي بي تي” على التحول بسلاسة إلى حرباء ثقافية أمراً مربكاً، وكانت المرة الأولى التي شعرت فيها تقريباً أنني لم أكن أتحدث إلى مجرد آلة. حتى أنني وجدت نفسي أرد كما لو كنت أتحدث إلى شخص حقيقي، وقلت للأداة “آسفة على المقاطعة” و”شكراً جزيلاً”.
هذا الأمر لا يقتصر علي أنا فقط. فإتقان خاصية الصوت المتقدمة للهجات المنطوقة أمر محير. وقد شارك مؤسس شركة ناشئة من جامايكا مقطعاً له وهو يتحدث مع “تشات جي بي تي” باللهجة المحلية، “الباتوا”. فغمرت مقاطع الفيديو منصة “تيك توك” وأظهرت التطبيق وهو يتحدث في كل شيء بجميع اللهجات من السينغليش (أو لهجة سنغافورة في اللغة الإنجليزية) إلى اللغة الإنجليزية الأفريقية الأميركية الدارجة.
تفتح قدرة “تشات جي بي تي” على التواصل باللهجات الأبواب على مصراعيها أمام مزيد من الناس للتفاعل مع هذه الأداة وإضفاء الطابع الإنساني عليها. قد يبدو كل ذلك مجرد حيلة للفت الأنظار، ولكن أي شخص سافر بعيداً عن وطنه يعرف أن اللغة والثقافة تجتاز الحواجز. فسماع شخص ما يتحدث مثلك، بأي لغة، يخلق على الفور شعوراً بالقرابة.
عواقب خطيرة محتملة
بالنسبة إلى معظم عصر الإنترنت، كان هذا النوع من الفروق الثقافية الدقيقة شيئاً لم تتمكن أجهزة الكمبيوتر من إدراكه بعد، مما يشكل واحداً من أهم الفوارق بين الصديق أو الآلة.
ولكن هناك عواقب محتملة لاستخدام اللهجات مع الذكاء الاصطناعي. إذ وجدت دراسة نشرت في مجلة “نيتشور” (Nature) في أغسطس أن النماذج اللغوية الكبيرة تنتج “انحيازات عنصرية خفية” حول الأشخاص بناءً على لهجاتهم في تجربة نصية.
وجد الباحثون أن الذكاء الاصطناعي يرجح أن يقترح تعيين مستخدمي اللغة الإنجليزية الأفريقية الأميركية “في وظائف أدنى درجة، وإدانتهم بارتكاب الجرائم والحكم عليهم بالإعدام” بدرجة أكبر مقارنة بمتحدثي اللغة الإنجليزية الأميركية القياسية.
مخاطر لا ندرك أبعادها
على صعيد منفصل، اعترفت “أوبن إيه آي” بأن القدرات الصوتية، تحديداً، لنموذجها الأحدث قد تصاحبها مخاطر لا ندرك أبعادها كاملة حتى الآن، مثل أن يقيم الناس علاقات قوية مع الذكاء الاصطناعي أو يتعاملوا بـ”ثقة زائدة غير محسوبة” في نماذجه.
لاحظت الشركة أن المستخدمين يستفيدون من الميزات الصوتية باستخدام لغة قد تشير إلى أنهم يشعرون بعلاقات تربطهم مع نموذج الذكاء الاصطناعي، قائلة إن هناك حاجة إلى إجراء مزيد من الدراسات الداخلية والمستقلة لتحديد “هذه المساحة من المخاطر تحديداً ملموساً”.
ويرجع السبب في أن روبوت الدردشة يبدو الآن شبيهاً بالإنسان إلى هذه الدرجة جزئياً إلى أن أصواته التسعة مدعومة من قبل فاعلين حقيقيين.
لدى “أوبن إيه آي” مجموعة من الضمانات. فقد أجاب “تشات جي بي تي” على بعض الأسئلة التي طرحتها بتغيير الموضوع، قائلاً إن دليله الاسترشادي لن يسمح له بالرد. فلا يمكنه الغناء أو تقليد الأشخاص أو الإفراط الشديد في الغزل.
كما توقف الإصدار الحالي عند حدود الترجمة الحية بشيء آخر غير صوتي أنا الخاص، مثل إلقاء كلمة أو حديث مصور، ربما لتجنب المزيد من التحقيقات الخاصة بحقوق النشر. أما المراقبون من أصحاب النظرة الثاقبة فينتقدون كفاءته في بعض اللغات واللهجات. وبسبب العقبات التنظيمية، لم تتح خاصية الصوت المتقدمة بعد في الاتحاد الأوروبي وبعض الأسواق القليلة الأخرى.
هناك إيجابيات هائلة محتملة لقدرة “تشات جي بي تي” الجديدة على تحطيم حواجز اللغة، لكل من الشركات والأفراد. ولكن بقدر ما كنت مفتونة في الأسبوع الماضي، كنت أحصل من حين لآخر على رد يذكرني بأنه مجرد تطبيق إلكتروني – لا ينبغي أن أحمله مسؤولية كبيرة أو أعتبره رفيقاً من البشر. لم أستطع سوى أن أشعر بالقلق على مستقبل قد ينسى فيه الناس ذلك.