مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

54 خبر
  • إسرائيل تواصل غاراتها على لبنان
  • مونديال 2026
  • العملية العسكرية الروسية في أوكرانيا
  • إسرائيل تواصل غاراتها على لبنان

    إسرائيل تواصل غاراتها على لبنان

  • مونديال 2026

    مونديال 2026

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • منتدى بطرسبورغ الاقتصادي الدولي

    منتدى بطرسبورغ الاقتصادي الدولي

  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • نبض الملاعب

    نبض الملاعب

  • فيديوهات

    فيديوهات

  • أزمة تهدد مواعيد مباريات كأس العالم 2026

    أزمة تهدد مواعيد مباريات كأس العالم 2026

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
صورة تعبيرية / Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

"هذا ما يجب على طهران فعله".. وزير الخارجية الأمريكي يحدد شرطين لرفع الحصار عن إيران

مكالمة مليئة بالألفاظ النابية.. الرئيس ترامب ينفجر غضبا ويوبخ نتنياهو بسبب لبنان

وزارة الدفاع الكويتية: نتعرض لهجوم بالصواريخ والطائرات المسيرة (صورة + فيديو)

"دولة تحت الوصاية ورئيس وزراء دمية".. هجوم حاد على نتنياهو عقب تراجعه عن مهاجمة الضاحية الجنوبية

"نافيا المحادثة البذيئة".. مسؤول إسرائيلي: ترامب لم يوبخ نتنياهو

تنم عن عدم ثقة.. قناة عبرية تكشف تفاصيل اتفاق بين ترامب ونتنياهو سبق المكالمة الكارثية

حان الوقت لإبرام صفقة.. ترامب ينفي توقف المحادثات بين واشنطن وطهران

وكالة "مهر": سماع دوي انفجارات قرب جزيرة قشم الإيرانية

مصدر حكومي مصري: قمنا بإجراءات احترازية لتأمين احتياجات البلاد من الغاز تحسبا لأي طارئ

نتنياهو لترامب: موقفنا ثابت وسنواصل العمليات في الجنوب وسنضرب بيروت إذا لم يكف حزب الله عن مهاجمتنا

ترامب: إيران لم تبلغنا بقرارها تعليق المحادثات ولا يعني ذلك أننا سنبدأ بإلقاء القنابل

أبو عبيدة: عدونا الجبان يتوهم إضعافنا باغتيال قادتنا لكن دماءهم هي الوقود الذي يحرك سفينتنا (فيديو)

سيناتور أمريكي لروبيو: نحن أقوى دولة ومع ذلك وصلنا إلى طريق مسدود مع إيران