مایکروسافت پس از اعلام موجی از بهروزرسانیها برای مجموعه محصولات مبتنی بر هوش مصنوعی کاپیتان خود، اکنون قابلیتهای جدید کاپیتان را برای همه کاربران در ویندوز راهاندازی کرده است، از جمله ابزاری که میتواند محتوای صفحه نمایش شما را درک کند و به سوالات در مورد آن پاسخ دهد.
دنیای برند- برندنیوز؛ یک هفته پس از اعلام موجی از بهروزرسانیها برای مجموعه محصولات مبتنی بر هوش مصنوعی کاپیتان خود، مایکروسافت قابلیتهای جدید کاپیتان را برای همه کاربران در ویندوز راهاندازی کرده است، از جمله ابزاری که میتواند محتوای صفحه نمایش شما را درک کند و به سوالات در مورد آن پاسخ دهد.
اپلیکیشنهای بهروزرسانی شده کاپیتان برای iOS، اندروید، ویندوز و وب امروز در حال عرضه هستند و همه آنها دارای یک کاپیتان با سبک «گرمتر» و «متفاوت» هستند، همانطور که مایکروسافت توصیف میکند. مایکروسافت همچنین کاپیتان را به واتساپ میآورد و به کاربران اجازه میدهد تا با کاپیتان از طریق پیامهای مستقیم چت کنند، مشابه تجربهای که با سایر باتها در پلتفرم پیامرسانی متا دریافت میکنید.
کاپیتان بینایی
کاپیتان بینایی دیدگاهی از آنچه شما در رایانه خود مشاهده میکنید دارد – بهطور خاص، یک لنز به سایتهایی که با Microsoft Edge بازدید میکنید. کاپیتان بینایی، که پشت درهای آزمایشگاه کاپیتان، یک برنامه جدید با دسترسی انحصاری برای کاربران کاپیتان پرو برای قابلیتهای آزمایشی کاپیتان است، میتواند متن و تصاویر در صفحات وب را تجزیه و تحلیل کند و به پرسشها (مانند «دستور پخت غذای موجود در این تصویر چیست؟») در مورد آنها پاسخ دهد.
بینایی، که با تایپ «@copilot» در نوار آدرس Edge قابل دسترسی است، دقیقاً یک معجزه فنی نیست. گوگل نیز فناوری جستجوی مشابهی را در اندروید ارائه میدهد و اخیراً قطعاتی از این فناوری را به کروم نیز آورده است.
اما مایکروسافت پیشنهاد میکند که کاپیتان بینایی قدرتمندتر و آگاهتر از ویژگیهای قبلی تجزیه و تحلیل صفحه نمایش است.
مایکروسافت در یک پست وبلاگی که با TechCrunch به اشتراک گذاشته شد، نوشت: «کاپیتان بینایی میتواند … گامهای بعدی را پیشنهاد کند، به سوالات پاسخ دهد، به شما در انجام هر کاری که میخواهید کمک کند و در انجام وظایف کمک کند، همه اینها در حالی که شما به سادگی با آن به زبان طبیعی صحبت میکنید.» «تصور کنید که میخواهید یک آپارتمان جدید را مبله کنید. کاپیتان بینایی میتواند به شما در جستجوی مبلمان، پیدا کردن پالت رنگ مناسب، بررسی گزینههای خود در مورد همه چیز از فرش تا پتو و حتی پیشنهاد راههایی برای چیدمان آنچه که مشاهده میکنید، کمک کند.»
استفاده از کاپیتان بینایی برای پرسیدن سوالات در مورد یک عکس در وب.
بدون شک مشتاق به جلوگیری از دور دیگری از تبلیغات بد از اشتباهات حریم خصوصی هوش مصنوعی، مایکروسافت تاکید میکند که کاپیتان بینایی برای حذف دادهها بلافاصله پس از مکالمات طراحی شده است. دادههای پردازش شده صوتی، تصویری یا متنی ذخیره یا برای آموزش مدلها استفاده نمیشوند، حداقل در این نسخه پیشنمایش.
کاپیتان بینایی همچنین در انواع وبسایتهایی که میتواند تفسیر کند محدود است. در حال حاضر، مایکروسافت از کار کردن این ویژگی در محتوای پرداختی و «حساس» جلوگیری میکند و بینایی را به لیستی از وبسایتهای «محبوب» پیشتایید شده محدود میکند.
محتوای «حساس» دقیقاً شامل چه چیزی میشود؟ پورن؟ خشونت؟ در این مقطع، مایکروسافت نمیگوید.
متهم شدن به دور زدن دیوارهای پرداختی با ابزارهای هوش مصنوعی، مایکروسافت را در گذشته اخیر در آب گرم حقوقی قرار داده است. در یک دادخواست در حال انجام، نیویورک تایمز ادعا کرد که مایکروسافت به کاربران اجازه میداد با ارائه مقالات نیویورک تایمز از طریق چتبات کاپیتان در بینگ، دیوار پرداختی آن را دور بزنند. طبق گفته نیویورک تایمز، هنگامی که با روش خاصی درخواست میشد، کاپیتان – که توسط مدلهای همکار نزدیک مایکروسافت OpenAI پشتیبانی میشود – قطعات دقیقی یا نزدیک به دقیقی از داستانهای پولی را ارائه میداد.
مایکروسافت گفت که کاپیتان بینایی، که در حال حاضر فقط در ایالات متحده در دسترس است، از «کنترلهای قابل خواندن توسط ماشین» در وبسایتها مانند قوانینی که مانع از جمعآوری دادهها توسط رباتها برای آموزش هوش مصنوعی میشوند، پیروی خواهد کرد. اما این شرکت دقیقاً نگفته است که کدام کنترلها را بینایی رعایت خواهد کرد؛ چندین مورد وجود دارد که در حال استفاده هستند. ما از مایکروسافت درخواست توضیح کردهایم.
بسیاری از ناشران بزرگ تصمیم گرفتهاند که ابزارهای هوش مصنوعی را از جستجو در وبسایتهای خود مسدود کنند، نه تنها به دلیل ترس از استفاده بدون اجازه از دادههای آنها، بلکه برای جلوگیری از افزایش هزینههای سرور خود توسط این ابزارها. اگر روند فعلی ادامه یابد، کاپیتان بینایی ممکن است روی برخی از وبسایتهای برتر خبری کار نکند.
مایکروسافت گفت که متعهد است برای رفع نگرانیها «بازخورد را دریافت کند».
«قبل از راهاندازی گسترده، ما به… اصلاح اقدامات ایمنی خود و حفظ حریم خصوصی و مسئولیت در مرکز همه کاری که انجام میدهیم ادامه خواهیم داد»، مایکروسافت در پست وبلاگی گفت. «هیچ پردازش خاصی از محتوای وبسایتی که شما با کاپیتان مرور میکنید وجود ندارد و هیچ آموزش هوش مصنوعی نیز انجام نمیشود – کاپیتان بینایی به سادگی تصاویر و متنی را که در صفحه میبیند برای اولین بار همراه با شما میخواند و تفسیر میکند.»
فکر عمیقتر
مانند بینایی، ویژگی جدید کاپیتان به نام فکر عمیقتر، تلاشی برای همه کارهتر کردن دستیار مایکروسافت است.
مایکروسافت گفت که فکر عمیقتر به کاپیتان توانایی استدلال در مورد مشکلات پیچیدهتر را میدهد، به لطف «مدلهای استدلال» که قبل از پاسخ دادن با پاسخهای گام به گام، زمان بیشتری میگیرند.
کدام مدلهای استدلال؟ مایکروسافت هنگام پرسیدن کمی محتاط بود و فقط گفت که فکر عمیقتر از «آخرین مدلهای OpenAI، که توسط مایکروسافت تنظیم شدهاند» استفاده میکند. با خواندن بین خطوط، میتوان حدس زد که آنها یک نسخه سفارشی از مدل o1 OpenAI هستند.
مایکروسافت در یک پست وبلاگی نوشت: «ما فکر عمیقتر را برای کمک به انواع چالشهای عملی و روزمره مانند مقایسه دو گزینه پیچیده طراحی کردهایم.» «فکر عمیقتر میتواند در هر چیزی از حل مسائل ریاضی دشوار تا سنجش هزینههای مدیریت پروژههای خانگی به شما کمک کند.»
مایکروسافت در مطالب رسانهای خود بسیار درباره پتانسیل فکر عمیقتر صحبت کرد. اما با فرض اینکه مدل زیربنایی آن o1 است، قطعاً در برخی زمینهها کم خواهد آورد. ما کنجکاو هستیم که ببینیم مایکروسافت چه نوع بهبودهایی را در مدل پایه انجام داده است و فکر عمیقتر تا چه حد محدودیتهای خود را نشان میدهد.
فکر عمیقتر از امروز برای تعداد محدودی از کاربران آزمایشگاه کاپیتان در استرالیا، کانادا، نیوزیلند، ایالات متحده و بریتانیا در دسترس خواهد بود.
کاپیتان صدا
کاپیتان صدا یک ویژگی جدید کاپیتان است که امروز بهطور کلی در دسترس است (نباید با کاپیتان صدا در گیتهاب اشتباه گرفته شود). کاپیتان صدا ابتدا در نیوزیلند، کانادا، استرالیا، بریتانیا و ایالات متحده راهاندازی میشود و چهار صدای مصنوعی را اضافه میکند که به شما اجازه میدهد با کاپیتان صحبت کنید و پاسخهای آن را با صدای بلند بشنوید.
مانند حالت صدای پیشرفته OpenAI برای ChatGPT، کاپیتان صدا میتواند لحن شما را در طول مکالمات تشخیص دهد و متناسب با آن پاسخ دهد، و شما میتوانید در هر زمان که کاپیتان صدا در حال پاسخ دادن است، مداخله کنید. یک سخنگوی مایکروسافت به من گفت که این حالت از «آخرین فناوری صدا با مدلهای جدید که برای برنامه کاپیتان تنظیم شدهاند» استفاده میکند. اما در مورد جزئیات فنی، اطلاعات دقیقی ارائه نشده است.
یک نکته قابل توجه این است که کاپیتان صدا دارای محدودیت استفاده بر اساس زمان است. مشترکین کاپیتان پرو دقیقههای بیشتری دریافت میکنند، اما این تعداد «متغیر» است و به گفته مایکروسافت، به تقاضا بستگی دارد.
شخصیسازی
مایکروسافت اعلام کرد که کاپیتان بهزودی با توجه به علایق و ترجیحات شما شخصیسازی خواهد شد.
هنگامی که این تنظیم فعال شود، کاپیتان از تعاملات و تاریخچه گذشته شما، و همچنین تعاملات شما با سایر برنامهها و خدمات مایکروسافت (مایکروسافت در مورد این موارد اطلاعاتی ارائه نمیدهد) استفاده خواهد کرد تا روشهای استفاده از کاپیتان را به شما پیشنهاد دهد.
مایکروسافت در یک پست وبلاگی نوشت: «این به شما کمک میکند تا شروع کنید و هم یک راهنمای مفید برای ویژگیهای مفید کاپیتان و هم آغازگرهای مکالمه را ارائه میدهد.»
شخصیسازی در کاپیتان، که میتواند در منوی تنظیمات کاپیتان در ویندوز خاموش شود، بهزودی در بریتانیا یا اتحادیه اروپا در دسترس نخواهد بود. اما کاربران در سایر مناطق باید شروع به مشاهده این تنظیم از بعدازظهر امروز کنند.
مایکروسافت و اتحادیه اروپا رابطه پرتنشی در مورد راهاندازی محصولات هوش مصنوعی این شرکت داشتهاند. در ماه مه، اتحادیه اروپا به مایکروسافت هشدار داد که ممکن است تحت رژیم حاکمیت آنلاین این بلوک، قانون خدمات دیجیتال، تا ۱ درصد از گردش مالی سالانه جهانی خود جریمه شود، زیرا این شرکت نتوانسته بود به درخواست اطلاعاتی که بر ابزارهای تولیدی هوش مصنوعی آن متمرکز بود، پاسخ دهد.
چندین غول فناوری فراتر از مایکروسافت، از جمله اپل و متا، رویکرد محتاطانهای در پیش گرفتهاند تا ابزارهای هوش مصنوعی را در اتحادیه اروپا راهاندازی کنند، زیرا از نقض قوانین اتحادیه اروپا در مورد حریم خصوصی دادهها و استقرار مدلها نگران هستند.
یک سخنگوی مایکروسافت به TechCrunch گفت: «برای کاربران در منطقه اقتصادی اروپا (EEA) و تعداد محدودی از کشورهای دیگر، ما در حال ارزیابی گزینهها قبل از ارائه این سطح از شخصیسازی کاپیتان برای آن کاربران هستیم.» «برخی از ویژگیها تا تاریخ بعدی در EEA در دسترس نخواهند بود.»
منبع: تک کرانچ