مارک زاکربرگ، مدیرعامل متا، در تلاش برای دفاع از استفاده این برند از دادههای دارای حق تکثیر در آموزش مدلهای هوش مصنوعی، به نبرد یوتیوب برای حذف محتوای دزدی متوسل شده است. این استناد، در حالی مطرح میشود که متا با اتهامات جدیدی در پرونده حقوقی حق تکثیر روبرو است.
به گزارش دنیای برند نقل از تککرانچ، این شهادت، که بخشی از شکایتی است که توسط وکلای شاکیان به دادگاه ارائه شده، مربوط به پرونده حق تکثیر هوش مصنوعی کادری علیه متا است. این یکی از پروندههای متعددی است که در سیستم دادگاههای ایالات متحده جریان دارد و شرکتهای هوش مصنوعی را در برابر نویسندگان و سایر دارندگان حقوق مالکیت فکری قرار میدهد. در بیشتر موارد، متهمان در این پروندهها – شرکتهای هوش مصنوعی – ادعا میکنند که آموزش با محتوای دارای حق تکثیر، «استفاده منصفانه» است. بسیاری از دارندگان حق تکثیر با این موضوع مخالف هستند.
زاکربرگ در طول شهادت خود، بر اساس بخشهایی از رونوشتی که چهارشنبه شب منتشر شد، گفت: «برای مثال، من فکر میکنم ممکن است یوتیوب در نهایت برای مدتی میزبان برخی از مواردی باشد که مردم دزدی میکنند، اما یوتیوب در تلاش است تا آن موارد را حذف کند. و من تصور میکنم بخش عمدهای از مطالب یوتیوب خوب است و آنها مجوز انجام این کار را دارند.»
قطعاتی از شهادت زاکربرگ سرنخهایی از تفکر او در مورد محتوای دارای حق تکثیر و استفاده منصفانه ارائه میدهد. با این حال، باید توجه داشت که متن کامل شهادت منتشر نشده است. تککرانچ برای دریافت اطلاعات بیشتر با متا تماس گرفته است و در صورت پاسخ شرکت، این مقاله بهروز خواهد شد.
بر اساس این قطعات شهادت، به نظر میرسد زاکربرگ در حال دفاع از استفاده متا از مجموعه داده آموزشی کتابهای الکترونیکی به نام لیبجن برای توسعه خانواده مدلهای هوش مصنوعی خود به نام لاما است. لاما متا با مدلهای شاخص شرکتهای هوش مصنوعی مانند OpenAI رقابت میکند.
لیبجن که خود را «مجموعهکنندهی لینکها» توصیف میکند، دسترسی به آثار دارای حق تکثیر از ناشرانی از جمله سنجیج لرنینگ، مکمیلان لرنینگ، مکگرا هیل و پیرسون اجوکیشن را فراهم میکند. لیبجن بارها مورد شکایت قرار گرفته، دستور تعطیلی آن صادر شده و دهها میلیون دلار به دلیل نقض حق تکثیر جریمه شده است.
بر اساس پروندههای دادگاهی که این هفته فاش شد، زاکربرگ ظاهراً با وجود نگرانیهای موجود در تیمهای اجرایی و تحقیقات هوش مصنوعی متا در مورد پیامدهای قانونی، استفاده از لیبجن برای آموزش حداقل یکی از مدلهای لاما متا را تایید کرده است.
وکلای شاکیان، که شامل نویسندگان پرفروش سارا سیلورمن و تا-نهیسی کوتس هستند، به نقل از کارکنان متا، لیبجن را «مجموعه دادهای که میدانیم دزدی است» توصیف کرده و هشدار دادهاند که استفاده از آن «ممکن است موقعیت مذاکره [متا] با قانونگذاران را تضعیف کند.»
زاکربرگ در طول شهادت خود ادعا کرد که “واقعاً نام لیبجن را نشنیده است.”
زاکربرگ در جریان شهادت گفت: «من متوجه هستم که شما سعی دارید نظر من را در مورد لیبجن بگیرید، که من واقعاً نام آن را نشنیدهام. این فقط به این دلیل است که من از آن موضوع خاص اطلاعی ندارم.»
زاکربرگ در پاسخ به سوال یکی از وکلای شاکیان، دیوید بویس، توضیح داد که چرا ممنوع کردن استفاده از مجموعهای داده مانند لیبجن غیرمنطقی است.
او گفت: «آیا من میخواهم سیاستی علیه استفاده مردم از یوتیوب داشته باشم زیرا ممکن است برخی از محتواها دارای حق تکثیر باشند؟ نه. مواردی وجود دارد که اعمال چنین ممنوعیت کلی ممکن است کار درستی نباشد.»
زاکربرگ اظهار داشت که متا باید در مورد آموزش با مطالب دارای حق تکثیر “بسیار مراقب” باشد.
زاکربرگ بر اساس رونوشت شهادت خود گفت: «میدانید، [اگر] کسی وبسایتی را ارائه میکند و عمداً سعی در نقض حقوق افراد دارد… بدیهی است که این چیزی است که ما میخواهیم در مورد نحوه تعامل خود با آن محتاط یا مراقب باشیم یا شاید حتی از تعامل تیمهای خود با آن جلوگیری کنیم.»
اتهامات جدید
وکلای شاکیان در پرونده کادری علیه متا از زمان ثبت آن در دادگاه ناحیه شمالی کالیفرنیا، بخش سانفرانسیسکو در سال ۲۰۲۳، چندین بار شکایت را اصلاح کردهاند. آخرین شکایت اصلاحشده که توسط وکلای شاکیان در اواخر روز چهارشنبه ارائه شده، حاوی اتهامات جدیدی علیه متا است، از جمله اینکه این شرکت کتابهای دزدیشده خاصی در لیبجن را با کتابهای دارای حق تکثیر که برای مجوز در دسترس بودند، مقایسه متقابل کرده است. وکلا ادعا میکنند که متا از این تاکتیک برای تعیین این موضوع استفاده کرده که آیا منطقی است که به دنبال توافقنامه صدور مجوز با ناشر باشد.
بر اساس پرونده اصلاحشده، متا ظاهراً از لیبجن برای آموزش جدیدترین خانواده مدلهای لاما، لاما ۳ استفاده کرده است. شاکیان همچنین ادعا میکنند که متا از این مجموعه داده برای آموزش مدلهای لاما ۴ نسل بعدی خود استفاده میکند.
بر اساس پرونده اصلاحشده، محققان متا ظاهراً با درج «نمونههای نظارتشده» در تنظیم دقیق لاما، سعی کردهاند این واقعیت را که مدلهای لاما با مواد دارای حق تکثیر آموزش دیدهاند، پنهان کنند. و متا بر اساس شکایت اصلاحشده، تا همین آوریل ۲۰۲۴ کتابهای الکترونیکی دزدیشده را از منبع دیگری به نام Z-Library برای آموزش لاما دانلود کرده است.
Z-Library یا Z-Lib موضوع اقدامات حقوقی متعددی بوده است که توسط ناشران انجام شده است، از جمله توقیف دامنه و حذف وبسایتها. در سال ۲۰۲۲، شهروندان روسی که گفته میشود آن را اداره میکردند، به نقض حق تکثیر، کلاهبرداری اینترنتی و پولشویی متهم شدند.