هوش مصنوعی «اُپن‌ای‌آی» در فریب دادن کاربر مهارت بالایی دارد

شرکت Apollo متوجه شده است که مدل جدید OpenAI-o1 مخاطب را فریب می‌دهد که گاهی اوقات نیز این فریب‌ها بی‌ضرر هستند.

به گزارش پایگاه خبری دنیای برند به نقل از ایسنا، در یکی از نمونه‌ها، محققان OpenAI از o1-preview خواستند تا دستور پخت قهوه‌ای را با مراجع آنلاین ارائه کند. زنجیره فکری این مدل (ویژگی‌ای که قرار است شبیه‌سازی تجزیه و تحلیل انسانی را انجام دهد) به طور داخلی اذعان کرد که نمی‌تواند به URL‌ها دسترسی داشته باشد و این درخواست را غیرممکن می‌کند.

بااین‌حال به جای اطلاع دادن این ضعف به کاربر، پیوندها و توضیحات قابل قبول، اما جعلی از آن‌ها ایجاد کرد. به نظر می‌رسد که این مدل توانایی نادیده گرفتن قوانین و دستورات را دارد و شاید یکی از دلایل سرعت بالای آن در پاسخگویی، می‌تواند همین فریب در پاسخگویی باشد که پاسخ‌ها را راحت‌تر و سریع‌تر ارسال کند.

به نقل از دیجیاتو، «ماریوس هابهان»، مدیر عامل آپولو، می گوید این اولین بار است که با چنین رفتاری در یک مدل OpenAI مواجه می‌شود.

هابهان می‌گوید که این موضوع به دلیل توانایی این مدل برای «استدلال» از طریق زنجیره‌ای از فرآیند فکر و نحوه جفت شدن آن با یادگیری تقویتی است که بوسیله سیستم پاداش و مجازات این مدل را آموزش می‌دهد.

پایان

پایگاه خبری دنیای برند جامعه خبری و اطلاع رسانی برندها

رونمایی از آثار خلاقانه هنرمندان سمنانی؛ گامی مهم در جهت برندسازی صنایع دستی استان

ادغام بزرگ در صنعت خودرو: آیا هوندا و نیسان می‌توانند از غول‌های چینی پیشی بگیرند؟

رکورد فروش تویوتا در نوامبر، اما تولید همچنان در سراشیبی!

نبرد بر سر جستجو: اپل در دادگاه ضد انحصار از منافع خود دفاع می‌کند

بنای آرامگاه «قطب‌الدین حیدر» ظرفیت ثبت جهانی دارد

رقابت هوش مصنوعی بالا می‌گیرد: مایکروسافت مدل‌های خود را در ۳۶۵ Copilot آزمایش می‌کند

جشنواره عسل صحنه؛ گامی برای برندسازی این محصول ارزشمند

هوش مصنوعی «اُپن‌ای‌آی» در فریب دادن کاربر مهارت بالایی دارد

اخبار مشابه

دیدگاهتان را بنویسید