شرکتهای توسعهدهنده هوش مصنوعی مانند OpenAI و Cohere برای بهبود مدلهای خود، به شبکه وسیعی از مربیان انسانی متخصص نیاز دارند. این مربیان با دانش تخصصی خود، به مدلهای هوش مصنوعی کمک میکنند تا اطلاعات دقیق و مرتبط تولید کنند.
دنیای برند به نقل از رویترز، در سالهای اولیه، آموزش مدلهای هوش مصنوعی مانند ChatGPT یا رقیب آن Cohere برای تولید پاسخهای شبیه به انسان، نیازمند تیمهای عظیمی از کارگران کمهزینه بود که به مدلها کمک میکردند تا حقایق اساسی مانند اینکه آیا یک تصویر مربوط به یک ماشین یا یک هویج است را تشخیص دهند.
اما اکنون، بهروزرسانیهای پیچیدهتر مدلهای هوش مصنوعی در عرصه رقابتی شدید، نیازمند شبکهای در حال گسترش از مربیان انسانی با دانش تخصصی است، از جمله مورخان تا دانشمندان، برخی با مدرک دکترا.
ایوان ژانگ، یکی از بنیانگذاران Cohere، در مورد مربیان انسانی داخلی خود میگوید: «یک سال پیش، میتوانستیم با استخدام دانشجویان کارشناسی، به طور کلی به هوش مصنوعی آموزش دهیم که چگونه بهبود یابد.»
«اکنون ما پزشکان دارای مجوز را استخدام کردهایم تا به مدلها آموزش دهند که چگونه در محیطهای پزشکی رفتار کنند، یا تحلیلگران مالی یا حسابداران.»
Cohere، که آخرین ارزشگذاری آن بیش از ۵ میلیارد دلار بوده است، برای آموزش بیشتر با یک استارتآپ به نام Invisible Tech همکاری میکند. Cohere یکی از رقبای اصلی OpenAI است و در زمینه هوش مصنوعی برای کسبوکارها تخصص دارد.
استارتآپ Invisible Tech هزاران مربی را به صورت دورکاری استخدام میکند و به یکی از شرکای اصلی شرکتهای هوش مصنوعی از جمله AI21، مایکروسافت و OpenAI تبدیل شده است تا مدلهای هوش مصنوعی خود را برای کاهش خطاها، که در دنیای هوش مصنوعی به عنوان هذیان شناخته میشوند، آموزش دهند.
فرانسیس پدرازا، بنیانگذار Invisible، میگوید: «ما ۵۰۰۰ نفر در بیش از ۱۰۰ کشور در سراسر جهان داریم که دارای مدرک دکترا، کارشناسی ارشد و متخصص کار دانش هستند.»
Invisible بسته به محل کارگر و پیچیدگی کار، تا ۴۰ دلار در ساعت پرداخت میکند. برخی شرکتها مانند Outlier تا ۵۰ دلار در ساعت پرداخت میکنند، در حالی که یک شرکت دیگر به نام Labelbox میگوید که تا ۲۰۰ دلار در ساعت برای موضوعات «با تخصص بالا» مانند فیزیک کوانتومی پرداخت میکند، اما با ۱۵ دلار برای موضوعات پایه شروع میکند.
Invisible در سال ۲۰۱۵ به عنوان یک شرکت خودکارسازی گردش کار تأسیس شد که به شرکتهایی مانند DoorDash خدمات میرساند تا فهرست تحویل خود را دیجیتالی کنند. اما اوضاع زمانی تغییر کرد که یک شرکت تحقیقاتی نسبتاً ناشناخته به نام OpenAI در بهار ۲۰۲۲، قبل از راهاندازی عمومی ChatGPT، با آنها تماس گرفت.
پدرازا به رویترز گفت: «OpenAI با یک مشکل به سراغ ما آمد، که این بود که وقتی شما یک نسخه اولیه از ChatGPT را سؤالی میکردید، آن نسخه هذیان میگفت. شما نمیتوانستید به پاسخ آن اعتماد کنید.»
«آنها به یک شریک پیشرفته آموزش هوش مصنوعی نیاز داشتند تا یادگیری تقویتی با بازخورد انسانی را ارائه دهد.»
OpenAI به درخواست برای اظهار نظر پاسخ نداد.
هوش مصنوعی مولد، محتوای جدید را بر اساس دادههای گذشتهای که برای آموزش آن استفاده شده است، تولید میکند. با این حال، گاهی اوقات نمیتواند بین اطلاعات درست و غلط تمایز قائل شود و خروجیهای دروغین تولید میکند که به عنوان هذیان شناخته میشوند. در یک مثال قابل توجه، در سال ۲۰۲۳، یک چتبات گوگل اطلاعات نادرستی را در مورد اینکه کدام ماهواره اولین عکس را از یک سیاره خارج از منظومه شمسی گرفته بود، در یک ویدیوی تبلیغاتی به اشتراک گذاشت.
شرکتهای هوش مصنوعی آگاه هستند که هذیانها میتوانند جذابیت GenAI برای کسبوکارها را از بین ببرند و در حال تلاش برای کاهش آن با روشهای مختلف، از جمله استفاده از مربیان انسانی برای آموزش مفهوم واقعیت و خیال هستند.
از زمان همکاری با OpenAI، Invisible میگوید که به شرکای آموزشی هوش مصنوعی برای اکثر شرکتهای GenAI، از جمله Cohere، AI21 و مایکروسافت تبدیل شده است. Cohere و AI21 تأیید کردند که مشتریان آنها هستند. مایکروسافت تأیید نکرد که مشتری Invisible است.
پدرازا گفت: «این شرکتها همگی چالشهای آموزشی داشتند، جایی که هزینه شماره یک آنها قدرت محاسباتی بود و سپس هزینه شماره دو کیفیت آموزش است.»
چگونه کار میکند؟
OpenAI، که هیجان حول GenAI را آغاز کرد، تیمی از محققان دارد که به درستی با نام «تیم داده انسانی» شناخته میشوند که با مربیان هوش مصنوعی کار میکنند تا دادههای تخصصی برای آموزش مدلهای خود مانند ChatGPT جمعآوری کنند.
محققان OpenAI با آزمایشهای مختلفی مانند کاهش هذیانها یا بهبود سبک نوشتن و کار با مربیان هوش مصنوعی از Invisible و سایر فروشندگان، کار میکنند.
یک منبع آشنا با روندهای این شرکت گفت که در هر زمان، دهها آزمایش در حال انجام هستند، برخی با ابزارهایی که توسط OpenAI توسعه یافتهاند و برخی دیگر با ابزارهای فروشندگان.
بر اساس آنچه شرکتهای هوش مصنوعی میخواهند – از بهتر شدن در تاریخ سوئد یا انجام مدلسازی مالی – Invisible کارگرانی با مدارک مرتبط برای آن پروژهها استخدام میکند که بار مدیریت صدها مربی توسط شرکتهای هوش مصنوعی را کاهش میدهد.
ژانگ از Cohere گفت که او شخصاً از مربیان Invisible برای یافتن راهی برای آموزش مدل GenAI خود برای یافتن اطلاعات مرتبط از یک مجموعه داده بزرگ استفاده کرده است.
رقابت
از جمله رقبای در این فضا، Scale AI است، یک استارتآپ خصوصی با ارزشگذاری اخیر ۱۴ میلیارد دلار که به شرکتهای هوش مصنوعی مجموعههایی از دادههای آموزشی ارائه میدهد. این شرکت همچنین وارد حوزه ارائه مربیان هوش مصنوعی شده است و OpenAI را بهعنوان مشتری خود دارد. Scale AI به درخواستهای برای مصاحبه برای این داستان پاسخ نداد.
Invisible، که از سال ۲۰۲۱ سودآور بوده است، تنها ۸ میلیون دلار سرمایه اولیه جذب کرده است.
پدرازا گفت: «ما ۷۰ درصد مالکیت تیم را داریم و تنها ۳۰ درصد مالکیت سرمایهگذاران است. ما دورهای ثانویه را تسهیل میکنیم و آخرین قیمت معامله شده در یک ارزشگذاری نیم میلیارد دلاری بود.» رویترز نتوانست این ارزشگذاری را تأیید کند.
مربیان انسانی ابتدا از طریق کار برچسبگذاری دادهها که نیاز به صلاحیت کمتری داشت و همچنین دستمزد کمتری داشت، گاهی به پایین ۲ دلار، که عمدتاً توسط افرادی در کشورهای آفریقا و آسیا انجام میشد، وارد آموزش هوش مصنوعی شدند.
با راهاندازی مدلهای پیشرفتهتر توسط شرکتهای هوش مصنوعی، تقاضا برای مربیان تخصصی و در دهها زبان در حال افزایش است و یک طاقچه پردرآمد ایجاد میکند که در آن کارگران از موضوعات مختلف میتوانند بدون حتی دانستن نحوه کدنویسی، مربیان هوش مصنوعی شوند.
تقاضا از سوی شرکتهای هوش مصنوعی منجر به ایجاد شرکتهای بیشتری شده است که خدمات مشابهی ارائه میدهند.
ژانگ گفت: «صندوق ورودی من اساساً پر از شرکتهای جدید است که اینجا و آنجا ظاهر میشوند. من این را به عنوان یک فضای جدید میبینم که در آن شرکتها انسانها را فقط برای ایجاد داده برای آزمایشگاههای هوش مصنوعی مانند ما استخدام میکنند.»