یک هوش مصنوعی جدید میتواند صدای پارس سگها را برای ما انسانها ترجمه کند.
به گزارش پایگاه خبری دنیای برند به نقل از ایسنا، محققان دانشگاه «میشیگان» در یک مطالعه پیشرفته با موفقیت از هوش مصنوعی برای رمزگشایی پارس سگها استفاده کردند.
به نقل از آیای، رادا میهالسی(Rada Mihalcea) رئیس آزمایشگاه هوش مصنوعی دانشگاه میشیگان میگوید: پژوهش ما پنجره جدیدی را رو به این موضوع باز میکند که چگونه میتوانیم از آنچه تاکنون در پردازش گفتار ساختهایم، برای درک تفاوتهای ظریف پارس سگ استفاده کنیم.
این مطالعه همچنین امکان استفاده از هوش مصنوعی را برای شناسایی سن، جنسیت و نژاد سگها بر اساس پوست آنها بررسی کرد.
محققان بر این باورند که پارس سگ ارتباط نزدیکی با آنچه در سرش میگذرد، دارد و با شواهدی همسو است که نشان میدهند صداهای ایجاد شده توسط حیوانات دیگر مانند میمونها را میتوان بر اساس زمینه موقعیتی آنها پیشبینی کرد.
استفاده از هوش مصنوعی برای ارتباط با سگها
محققان در این مطالعه بر روی شناسایی احساسات خاص در پارس سگ، مانند پرخاشگری، عادی بودن و نق و غر زدن تمرکز کردند.
یک مدل هوش مصنوعی که با نام Wav۲Vec۲ شناخته میشود، بر روی دو مجموعه داده مختلف آموزش داده شد. یکی کاملاً از پارس سگ تشکیل شده بود و دیگری بر روی تقریباً ۱۰۰۰ ساعت صحبت انسان و سپس تنظیم دقیق با پارس سگ آموزش داده شده بود.
با کمال تعجب، مدلی که از قبل بر روی گفتار انسان آموزش داده شده بود، بهتر از مدلی بود که منحصراً با پارس سگ آموزش داده شده بود. این نشان میدهد که الگوها و ساختارهای ذاتی در زبان انسان میتواند به عنوان پایهای ارزشمند برای تفسیر صداها و آوازهای حیوانات باشد.
این مدل هوش مصنوعی با دقت متوسط ۷۰ درصد قادر به تفسیر حالت عاطفی سگها بود و بین پارسهای بازیگوشانه و با عصبانیت تمایز قائل شد.
علاوه بر این، این مدل توانست نژاد سگها را با دقت ۶۲ درصد و جنسیت را با دقت ۶۹ درصد شناسایی کند.
میهالسی افزود: پیشرفتهای هوش مصنوعی میتواند برای متحول کردن درک ما از ارتباطات با حیوانات استفاده شود و یافتههای ما نشان میدهد که ممکن است مجبور نباشیم از صفر شروع کنیم.
یک پایگاه داده متنوع
این تیم به رهبری آرتم ابزالیف دانشجوی دکتری در دانشگاه میشیگان مدلهای رایانهای موجود آموزش دیده با گفتار انسان را به دلیل فقدان پایگاه داده قابل مقایسه برای صداهای سگ، تغییر کاربری داد.
آنها پارس، غر و نالههای ۷۴ سگ از نژادها، سنین و جنسیتهای مختلف را در زمینههای مختلف جمعآوری کردند و آنها را به یک مدل یادگیری ماشینی تغذیه کردند.
میهالسی خاطرنشان کرد: این اولین بار است که تکنیکهای بهینهسازی شده برای گفتار انسان برای کمک به رمزگشایی ارتباطات حیوانات ساخته شده است.
نتایج نشان میدهد که صداها و الگوهای گفتار انسان میتواند به عنوان مبنایی برای تجزیه و تحلیل صداهای حیوانات استفاده شود.
در حالی که این جنبه از این پژوهش هنوز در مراحل اولیه خود است، پتانسیل تعمیق بیشتر درک ما از ارتباط با سگها را نشان میدهد.
این پژوهش پیشگامانه حاصل همکاری بین دانشگاه میشیگان و موسسه ملی اخترفیزیک، اپتیک و موسسه الکترونیک مکزیک است که گام مهمی را در زمینه ارتباطات با حیوانات نشان میدهد.
به نظر میرسد ما با استفاده از قدرت هوش مصنوعی یک قدم به درک آنچه که این دوستان قدیمی انسان میخواهند به ما بگویند، نزدیکتر شدهایم.
میهالسی در پایان گفت: ما هنوز چیزهای زیادی در مورد حیواناتی که در این جهان با ما بسیار صمیمی هستند، نمیدانیم.
پایان