برند OpenAI با بهروزرسانی قابلیتهای تولید تصویر در ChatGPT، گامی بزرگ در مسیر توسعه هوش مصنوعی برداشت. این قابلیت که از مدل قدرتمند GPT-4o بهره میبرد، اکنون امکان خلق و ویرایش تصاویر را بهصورت بومی فراهم کرده است. این پیشرفت، برند OpenAI را در رقابت با دیگر غولهای فناوری مانند گوگل به جایگاه بالاتری میرساند.
به گزارش دنیای برند، این قابلیت جدید به مدل هوش مصنوعی GPT-4o امکان میدهد که بهطور بومی تصاویر و عکسها را تولید و ویرایش کند. پیشتر، این مدل تنها قادر به پردازش و تولید متن بود، اما اکنون میتواند مستقیماً تصاویر را ایجاد کند و تغییر دهد.
آلتمن اعلام کرد که قابلیت جدید تولید تصویر از امروز برای کاربران حرفهای OpenAI در سرویس ChatGPT و پلتفرم تولید ویدئوی Sora فعال شده است. کاربران اشتراک Pro که ماهانه ۲۰۰ دلار پرداخت میکنند، نخستین گروهی هستند که به این ویژگی دسترسی دارند. OpenAI همچنین اعلام کرد که این قابلیت بهزودی برای کاربران طرح Plus و نسخه رایگان ChatGPT، همچنین توسعهدهندگانی که از API شرکت استفاده میکنند، در دسترس قرار خواهد گرفت.
مدل GPT-4o با قابلیت تولید تصویر، زمان پردازش بیشتری نسبت به مدل قبلی DALL-E 3 دارد، اما در مقابل، دقت و جزئیات بهتری ارائه میدهد. این مدل همچنین میتواند تصاویر موجود را ویرایش کند، از جمله تصاویری که افراد در آن حضور دارند. ویژگی “Inpainting” در این مدل به کاربران امکان میدهد جزئیاتی مانند اشیای پسزمینه و پیشزمینه را تغییر دهند یا بازسازی کنند.
استفاده از دادههای عمومی و مشارکتهای تجاری
برای آموزش این قابلیت جدید، OpenAI از دادههای عمومی موجود در اینترنت و همچنین دادههای اختصاصی حاصل از همکاریهای تجاری، از جمله همکاری با Shutterstock، استفاده کرده است. این موضوع در حالی مطرح میشود که بسیاری از شرکتهای فعال در حوزه هوش مصنوعی، اطلاعات مربوط به دادههای آموزشی خود را محرمانه نگه میدارند تا از مزایای رقابتی خود محافظت کنند.
با این حال، استفاده از دادههای آموزشی همواره چالشهایی در حوزه حقوق مالکیت فکری (IP) به همراه دارد. برد لایتکپ، مدیر اجرایی OpenAI، در گفتوگو با والاستریت ژورنال اعلام کرد که:
“ما در تولید خروجیها به حقوق هنرمندان احترام میگذاریم و سیاستهایی داریم که از تولید تصاویری که مستقیماً آثار هنرمندان زنده را تقلید میکنند، جلوگیری میکند.”
OpenAI همچنین یک فرم انصراف ارائه داده است که به خالقان محتوا اجازه میدهد درخواست حذف آثار خود را از مجموعه دادههای آموزشی این شرکت ثبت کنند. علاوه بر این، OpenAI اعلام کرده که به درخواستهایی که مانع از جمعآوری دادههای تصویری توسط خزندههای وب این شرکت میشوند، احترام میگذارد.
رقابت با برندهای مطرح در دنیای هوش مصنوعی
این بهروزرسانی جدید OpenAI در حالی معرفی شده که گوگل نیز اخیراً قابلیت تولید تصویر را در مدل هوش مصنوعی Gemini 2.0 Flash آزمایش کرده است. اما برخلاف OpenAI، نسخه آزمایشی گوگل با چالشهای زیادی روبهرو شد و کاربران دریافتند که این مدل میتواند واترمارکها را حذف کند یا تصاویری از شخصیتهای دارای حقوق مالکیت تولید کند، که انتقادات زیادی را به همراه داشت.
به گزارش تککرانچ، با این تغییرات، برند OpenAI تلاش دارد تا نهتنها رقابت را با شرکتهای بزرگی مانند گوگل و DeepMind ادامه دهد، بلکه استانداردهای جدیدی را در حوزه هوش مصنوعی مولد تعریف کند.