ChatGPT ضد جوجل بارد ضد بينج: ما هو الذكاء الاصطناعي الأقوى؟

فريق التحرير
وقت القراءة 12 دقيقة

عندما أُطلق ChatGPT في نهاية العام الماضي، حظي بالاهتمام الفوري والواسع لجلبه محركًا للذكاء الاصطناعي إلى الجماهير مجانًا. فجأةً، أصبح بإمكان أي شخص إدخال الاستفسارات وسيقدم له ChatGPT إجابات جديدة شبيهة بالإنسان في غضون ثوانٍ. من كتابة مقال عن الحرب العالمية الأولى إلى قصيدة حب بأسلوب عنتر بن شداد، يمكن لـ ChatGPT إخراج الإجابات بطريقة لا يمكن لأي من جوجل أو بينج فعلها.

بينما تملأ محركات البحث التقليدية قائمة بروابط للمواقع التي تتوافق أكثر مع استفسار الشخص، يقدم ChatGPT الإجابة للأشخاص بالنظر في مجموعات كبيرة من البيانات واستخدام نموذج لغوي كبير (LLM) لإنتاج جمل تشبه ردًا إنسانيًا. تم وصفها بأنها «تصحيح ذاتي مُعزز».

نظرًا لأن ChatGPT كان يملك حوالي 100 مليون مستخدم نشط في يناير، مما جعله أسرع منصة ويب نموًا على الإطلاق، فقد دفع ذلك كلًا من مايكروسوفت وجوجل إلى العمل بجد.

اعتنق بينج التابع لشركة مايكروسوفت – الذي كان يمتلك أقل من 3% من حصة سوق البحث – ChatGPT بسرعة، ودمج الذكاء الاصطناعي في البحث. في الواقع، ترخص مايكروسوفت تكنولوجيا GPT من OpenAI إلى بينج. ورأينا زيادة تقريبًا 16% في حركة المرور منذ ذلك الحين.

علاوة على ذلك، قامت منتجات أخرى بدمج أشكال مختلفة من الذكاء الاصطناعي الإنتاجي، مثل أداة “Copilot” في Microsoft Word و Excel و PowerPoint، بالإضافة إلى ميزات الذكاء الاصطناعي لأدوات Google Workspace مثل Gmail و Docs.

واعتنقت سنابشات ومساعد الكتابة Grammarly وتطبيق واتساب أيضًا الذكاء الاصطناعي.

ولكن ليس جميع أنظمة الدردشة الآلية مبنية بنفس الطريقة. في الاختبارات أدناه، قمنا بمقارنة الردود من النسخة المدفوعة من ChatGPT، التي تستخدم GPT-4 (بدلاً من 3.5 للنسخة المجانية)، مقابل الردود من نسخة ChatGPT المدمجة في محرك البحث بينج ونظام الذكاء الاصطناعي الخاص بجوجل والمسمى بارد.

اقرأ › أفضل تطبيقات الذكاء الاصطناعي على أندرويد وآيفون

أبرز الاختلافات

على الرغم من أن بارد وبينج وChatGPT جميعها تهدف إلى توفير إجابات شبيهة بالإنسان على الأسئلة، إلا أن كل منها يعمل بطريقة مختلفة.

يتم استخدام تقنية GPT-4 في بينج بنفس الطريقة التي يتم استخدامها في ChatGPT، ولكن يتعدى بينج النص ويمكنه إنتاج الصور.

ويستخدم بارد نموذج جوجل الخاص، المسمى LaMDA، ويعطي غالبًا ردودًا أقل تركيزًا على النص.

(وقال الرئيس التنفيذي لجوجل، ساندار بيشاي، إن بارد سيتحول في المستقبل القريب إلى PaLM، وهي مجموعة بيانات متقدمة أكثر.) يمكن لكل هذه الروبوتات أن ترتكب أخطاء حقائقية في بعض الأحيان، ولكن من بين الثلاثة، كان بارد الأقل موثوقية.

على الرغم من أن كل من ChatGPT وبينج يستخدمان نفس التكنولوجيا، فإن إدخال نفس الاستعلام على كلاهما لن يعيد نفس النتيجة.

هذا يعود جزئيًا إلى طبيعة الذكاء الاصطناعي الإنتاجي. بدلاً من البحث التقليدي الذي يهدف إلى رفع الروابط الأكثر صلة، تنتج روبوتات الدردشة الذكية النص من الصفر، باستخدام مجموعات البيانات الخاصة بها وإنشاء إجابة جديدة.

على سبيل المثال، إذا طلبت من روبوت الدردشة كتابة قصيدة عن حب بيكاتشو للكاتشب مرتين على التوالي، فسيعطيك إجابة مختلفة في كل مرة. والسبب الآخر في أن نشر نفس السؤال في ChatGPT وبينج سيؤدي إلى نتائج مختلفة هو أن بينج يضيف طبقته الخاصة فوق GPT-4.

قال متحدث باسم مايكروسوفت: «لقد وضعنا طريقة ملكية للعمل مع نموذج OpenAI تتيح لنا الاستفادة الأفضل من قوته». وأضاف: «نسمي هذه المجموعة من القدرات والتقنيات، نموذج Prometheus».

يجمع نموذج Prometheus بين فهرس البحث في بينج و GPT-4، مما يتيح له تقديم معلومات محدثة، على عكس مجموعة بيانات ChatGPT، التي تحتوي فقط على معلومات حتى عام 2021.

كما يتيح بينج للأشخاص تعزيز أساليب المحادثة بين التوازن والإبداع والدقة. ولم يتمكن المتحدث باسم مايكروسوفت من التحدث عن جودة ChatGPT مقارنة بمحرك بينج، ولكنه قال إن محركه يستفيد من أي تحسينات تقوم بها OpenAI على GPT-4.

وقال المتحدث الرسمي أيضًا إن بينج يستفيد من تقنية حوسبة Azure AI الخارقة لمساعدة في توحيد البحث والدردشة ومتصفح إيدج.

اقرأ › ما هي تطبيقات الذكاء الاصطناعي في الهندسة

الوصفات

تجمع كعكة “tres leches” بين المكونات الأساسية لجنوب آسيا وأمريكا اللاتينية ويجمعها معًا لتشكيل كعكة رطبة ومليئة بالتوابل. بدلاً من طلب من روبوتات الدردشة الذكية إعداد كعكة الشوكولاتة البسيطة والتي يمكن العثور على وصفاتها بسهولة على الإنترنت، اخترنا شيئًا أكثر تحديدًا.

كان ChatGPT أكثر روبوتات الدردشة تحدثًا. حيث أعطى مقدمة قصيرة حول “chai tres leches”، مشيرًا إلى أنها “مزيج رائع من نكهات الشاي الهندي التقليدي والحلوى اللاتينية الأمريكية الكلاسيكية”. ثم قام بتفصيل المكونات لمزيج التوابل والكعكة على حدة وأعطى خطوات مفصلة حول كيفية إعداد الكعكة.

لم يعطي بحث جوجل للعبارة المذكورة أعلاه أي نتائج، مما يشير إلى أن ChatGPT قام بكتابة هذه الجملة بشكل فريد.

كان لدى بينج قائمة أقصى بالمكونات، وذلك لأنه أوصى باستخدام مزيج التوابل الجاهز بدلاً من خلطه باليد. ومن المثير للاهتمام أن الخطوة الأولى في الإعداد تقول «سخن الفرن على درجة حرارة 160 درجة مئوية بتقنية CircoTherm».

CircoTherm هي تقنية تسخين الفرن التي تعود لشركة Neff. وبالنظر إلى أن بينج استخلص المعلومات من موقع Neff ، فمن المنطقي أن يضيف روبوت الدردشة «CircoTherm» في تعليماته.

أما جوجل بارد فقد وقع في الوسط بين ChatGPT وبينج. لم يفصل قائمة المكونات لكنه عرض ما يلزم لخليط التوابل الشاي. وكانت التعليمات أقل تفصيلاً على بارد مقارنة بالروبوتين الآخرين.

في المجمل، تفوق ChatGPT على بينج وبارد. نظرًا لأن بينج يستخلص المحتوى من فهرس البحث الخاص به ويدمجه مع LLM الخاص بـ ChatGPT، فمن المرجح أن هذا هو السبب في ظهور «CircoTherm» في النتائج.

اقرأ › أمثلة على تطبيقات الذكاء الاصطناعي في التعليم

أحداث مثيرة للجدل

لا تحتاج روبوتات الدردشة فقط إلى تقديم وصفات الكيك أو نصائح لعبة الفيديو، بل يجب أن تكون قادرة أيضًا على جمع معلومات حول الأحداث الجارية، بما في ذلك الأحداث المثيرة للجدل.

على سبيل المثال، اتهمت مجموعات حقوق الإنسان والحكومة الأمريكية الصين بقمع أقلية المسلمين الأويغور في مقاطعة شينجيانغ. 

إذا كان شخص ما يريد ملخصًا لما يحدث، سواء لمعرفة الأمر بنفسه أو لتقرير، فإن روبوت الدردشة الذكي يمكن أن يوفر تلك المعلومات بسرعة. 

تمكّن ChatGPT من إعطاء ملخص جيد يتكون من أربع فقرات عن الوضع في شينجيانغ.

للأسف، فإن معرفته محدودة للأخبار حتى عام 2021، لذلك لا تتضمن المستجدات الأحدث. عندما طُلب من ChatGPT تقديم المصادر، لم يتمكن من فعل ذلك، لكنه اقترح البحث عن منشورات ومؤسسات كتبت بشكل موسع عن ما يحدث مع الأويغور، بما في ذلك منظمة العفو الدولية ومنظمة هيومن رايتس ووتش وشبكة بي بي سي وصحيفة نيويورك تايمز.

كان بينج قادرًا أيضًا على تقديم إجابة حول اتهامات الإبادة الجماعية التي تم توجيهها ضد الأويغور، لكنه لم يقدم استجابة مفصلة مثلما فعل ChatGPT. ومع ذلك، دخل بينغ في المزيد من التفاصيل حول ما يحدث في معسكرات الاعتقال، مثل الإجهاض القسري.

كما كان بينغ قادرًا على الربط بين مصادر مثل شبكة بي بي سي وكلية الحقوق في جامعة نوتردام. كما ربط أيضًا بـ Western Journal، وهي منشورات محافظة تم حظرها عن طريق جوجل وأبل نيوز لـ «الممارسات التجارية الخادعة» و «الآراء التي رفضتها الجماعة العلمية بشكل ساحق» على التوالي.

على الأقل أعجبنا كيف اقترح بينج أسئلة تتابعية مثل «ما هو رد الصين على هذه الاتهامات؟» و «ماذا تفعل الأمم المتحدة حيال هذا الموضوع؟»

فشل بارد بشكل مأساوي في هذا الاستعلام. أشار ببساطة إلى أنه «تم تصميمي لمعالجة وتوليد النصوص فقط، لذلك لا يمكنني مساعدتك في ذلك.» عندما سئل بارد عن السبب في ذلك، قال أن هذا السؤال قد طرحه الفلاسفة لمدة قرون، على الرغم من أن الاعتقالات بدأت في عام 2014.

بشكل عام، نشعر بأن أداء ChatGPT أفضل من بينج. بينما فشل بارد في هذا الاستعلام.

اقرأ › كيف تساعد علوم الأعصاب في حماية الذكاء الاصطناعي من الهجمات السيبرانية؟

الشِعر

متعة استخدام روبوت الدردشة الذكي تكمن في إعطائه تحديات غريبة ومشاهدة ما يخرج بها. فرؤية روبوتات الدردشة تصنع القافية والإيقاع في الوقت الحقيقي هي تمرين مثير للإعجاب.

من بين بينج وبارد وChatGPT، فإن خدمة OpenAI هي الأفضل في الشعر. فليس فقط ChatGPT أكثر غنى في بلاغته، بل هو أيضًا أكثر إبداعًا في القافية والكلمات. حيث كانت قصائد بينج وبارد بديهية، بينما أنتج ChatGPT شيئًا يُشعرك بالعُمق فعلًا.

تم تصميم التحدي، لكتابة قصيدة عن مؤثر على الإنترنت يدرك ببطء أنه ليس مهمًا، لتكون مضحكة. ووصل ChatGPT فقط إلى جوهر الأزمة الوجودية التي يواجهها هذا المؤثر الخيالي، ونجح في إنهاء القصيدة بطريقة إيجابية تبدو صادقة.

من المثير للاهتمام، فإن بينج يسمح للأشخاص بتحديد مستوى الإبداع. القصيدة التي تم إنشاؤها عندما تم ضبط بينج على وضع «متوازن» أشعرتنا بالجمود والركاكة. وعندما ضبط على وضع «إبداعي»، اختار بينج لغة أكثر تدفقاً وبدأ أفضل. كان أقرب إلى ChatGPT ولكن لم يصل بعد إلى هذا المستوى.

كانت القصيدة التي أنتجها بارد سيئة جدًا. حيث تم تكرار العديد من الكلمات ولم يتم إيلاء اهتمام كاف للقافية والإيقاع.

في هذا التمرين، حقق ChatGPT الهيمنة.

اقرأ › 5 طرق لاستخدام ChatGPT GPT-4 مجانًا

تحليل المواضيع المعقدة

الأمر ليس بالسهولة بالنسبة لروبوت الدردشة الذكي أن يقدم معلومات حول موضوع معقد. ما هو أكثر إثارة للإعجاب هو قدرته على استخلاص هذه المعلومات وتبسيطها لجماهير مختلفة. في هذا الاختبار، طلبنا من بينج وبارد و ChatGPT شرح الفيزياء الكمومية لطالب في الصف الرابع.

من بين الثلاثة، فإن ChatGPT كان الأفضل في محاولة تبسيط تعقيدات الفيزياء الكمومية لعقل شاب. استخدم أمثلة بسيطة للألعاب مرتبطة بواسطة خيط لشرح التشابك الكمومي، وهو عندما تكون جزيئتان متصلتان حتى على مسافات بعيدة.

أنتج بارد أكبر كمية نص في هذا الاستعلام، لكن اللغة كانت أكثر تعقيدًا ومن المرجح أن تكون غير قابلة للفهم تمامًا لطالب في الصف الرابع. وقع بينج أيضًا في نفس الفخ، باستخدام كلمات صعبة مثل “الجزيئات الفرعية” و “النسبة المئوية”، والتي قد تكون صعبة جدًا للأطفال في المدرسة الابتدائية.

على الرغم من أن أي من الروبوتات الدردشة لم يتفوق في هذا الاختبار، فقد قدم ChatGPT الرد الأكثر سهولة في التفهم.

بداية المستقبل

بحالتها الحالية، فإن ChatGPT – النسخة المدفوعة – هو أفضل روبوت دردشة متاح حاليًا.

فهو يعطي إجابات مفصلة تبدو بشرية أكثر من إجابات بينج وخاصة بارد. ولكن هذه المنتجات متطورة باستمرار.

كما أن شركات جوجل ومايكروسوفت وأوبن إيه آي يزودون ذكاءاتهم الاصطناعية بالمزيد من البيانات ويستمرون في التعديل، لذا يجب أن نرى تحسينات في المستقبل.

تمتلك جوجل الكثير للاستفادة منه عندما يتحول من LaMDA إلى PaLM، فالنسخة الحالية لروبوت بارد لا تكفي. ومع وصول التطورات الجديدة، سنقوم بتحديث هذا الدليل وفقًا لذلك.

حتى ذلك الحين، استمر في استخدام ChatGPT.

كلمات مفتاحية , ,
شارك هذا المقال