کدخبر :325878 پرینت
06 مهر 1404 - 07:21

نخستین ربات متفکر جهان معرفی شد

شرکت دیپ‌مایند با رونمایی از پروژه Gemini Robotics نسل تازه‌ای از ربات‌ها را به نمایش گذاشته است؛ ربات‌هایی که پیش از انجام هر عمل، توانایی «فکر کردن» دارند.

متن خبر

به گزارش سیتنا، پژوهشگران این شرکت بر این باورند که این نوآوری سرآغاز عصری تازه در عرصه رباتیک هوشمند است.

هوش مصنوعی مولد که پیش‌تر در تولید متن، تصویر، صدا و ویدئو مورد استفاده قرار گرفته، اکنون پایه‌ای برای کنترل و تصمیم‌گیری در ربات‌ها شده است. ایده اصلی پروژه جمنای رباتیک استفاده از همین قابلیت برای ایجاد کنش در ربات‌هاست.

دیپ‌مایند در این پروژه از دو مدل تازه پرده‌برداری کرده که به‌طور مشترک نخستین ربات‌های متفکر جهان را تشکیل می‌دهند. این دو مدل با نام‌های Gemini Robotics ۱.۵ و Gemini Robotics-ER ۱.۵ معرفی شده‌اند.

مدل نخست، یک مدل دیداری-زبانی-کنشی است که ورودی‌های تصویری و متنی را دریافت کرده و بر اساس آن کنش‌های رباتیک تولید می‌کند. مدل دوم که «ER» نام دارد و مخفف «استدلال تجسم‌یافته» است، توانایی دارد ورودی‌ها را تحلیل کرده و گام‌های لازم برای انجام وظایف پیچیده را طراحی کند. 

به گفته دیپ‌مایند، این مدل نوعی «تفکر» شبیه‌سازی‌شده دارد که آن را از ربات‌های پیشین متمایز می‌سازد.

برای نمونه، اگر از ربات بخواهید لباس‌ها را به دو گروه سفید و رنگی تفکیک کند، مدل ER داده‌ها و تصاویر محیط را پردازش کرده و دستورالعملی به زبان طبیعی تولید می‌کند. سپس مدل Gemini Robotics ۱.۵ این دستورالعمل را اجرا کرده و حرکات لازم برای انجام وظیفه را تولید می‌کند. 

پژوهشگران می‌گویند این مدل افزون بر اجرا، فرآیندی درونی برای تصمیم‌گیری دارد که شبیه «فکر کردن» پیش از عمل است.

کارولینا پارادا، رئیس بخش رباتیک دیپ‌مایند، تأکید کرده است که ربات‌های امروزی بسیار اختصاصی هستند و آماده‌سازی آن‌ها برای یک وظیفه خاص ماه‌ها زمان می‌برد. اما با این رویکرد تازه، ربات‌ها انعطاف‌پذیرتر خواهند شد و بدون نیاز به آموزش دوباره می‌توانند با محیط‌های تازه تطبیق پیدا کنند.

مدل Gemini Robotics-ER ۱.۵ در آزمایش‌های داخلی و دانشگاهی امتیازات بالایی کسب کرده و نشان داده قادر است تصمیم‌های دقیقی در تعامل با محیط بگیرد. با وجود این، مدل اجرایی Gemini Robotics ۱.۵ هنوز تنها در دسترس گروه کوچکی از آزمایش‌کنندگان قرار دارد. در مقابل، مدل ER در Google AI Studio ارائه شده و به توسعه‌دهندگان امکان می‌دهد برای پروژه‌های رباتیک خود دستورالعمل‌های دقیق طراحی کنند.

به گفته پژوهشگران دیپ‌مایند، هر دو مدل بر پایه نسخه‌های اصلی جمنای ساخته شده و با داده‌های ویژه برای فعالیت در دنیای فیزیکی سازگار شده‌اند؛ قابلیتی که امکان اجرای وظایف چندمرحله‌ای و پیچیده را در اختیار ربات‌ها قرار می‌دهد.

انتهای پیام

برچسب ها

نظرات خود را با ما درمیان بگذارید

افزودن دیدگاه جدید

کپچا
CAPTCHA ی تصویری
کاراکترهای نمایش داده شده در تصویر را وارد کنید.