חזרה לכל החדשות
פוסט Corporate

גוגל מציגה: ג'מיני רובוטיקס ER 1.6 – קפיצת מדרגה בהבנה המרחבית של רובוטים אוטונומיים

 |  מקור: Google DeepMind

חוקרי Google DeepMind חושפים גרסה משופרת וממוקדת של מודל הבינה המלאכותית שלהם, המיועדת במיוחד להנחיית רובוטים בעולם הפיזי. המודל החדש, Gemini 1.5 Robotics ER (Embodied Reasoning), מתבסס על יכולות הבסיס של ג'מיני אך עבר אופטימיזציה יסודית למשימות המצריכות הבנה מרחבית מורכבת ותיאום בין זרמי מידע חזותיים שונים. החידוש המרכזי טמון ביכולת המערכת לעבד בו-זמנית מספר זוויות מבט – למשל, ממספר מצלמות על רובוט או מתצוגת מצלמת גוף – ולבצע עליהן חשיבה דדוקטיבית כדי להבין סצנה תלת-ממדית ולקבל החלטות מדויקות.

השיפור ביכולות ההנמקה הממומשת (Embodied Reasoning) נועד להתגבר על אחת המכשלות הגדולות של רובוטיקה אוטונומית: הפער בין ההבנה התאורטית של הסביבה לבין היכולת לפעול בתוכה בצורה בטוחה ויעילה. בעוד שרובוטים רבים מתבססים על מיפוי מראש או הוראות נוקשות, ER 1.6 מנסה להעניק לרובוט 'שכל ישר' ויכולת הסקה דינמית. זה מאפשר לו, למשל, לנווט בסביבה ביתית מבולגנת, לזהות שהדרך חסומה על ידי כיסא ולהבין שהוא צריך להזיז אותו או לבחור מסלול חלופי, מבלי שנדרשה לכך הוראה מפורשת בתוכנית.

ההשלכות של טכנולוגיה זו רחבות היקף. בתחום הלוגיסטיקה והמחסנים האוטומטיים, רובוטים בעלי הבנה מרחבית משופרת יוכלו לתפעל סחורה בצורה עצמאית ובטוחה יותר. בשירותים כמו סיעוד או סיוע לקשישים, רובוטים יוכלו לנווט טוב יותר בסביבה הביתית המשתנה ולהבחין בסכנות פוטנציאליות. המחקר של DeepMind מצביע על כך שהמודל מצליח יותר בגרסאותיו הגדולות יותר, מה שמרמז שקפיצות היכולת הבאות בתחום תלויות לא רק באלגוריתמים טובים יותר, אלא גם בכוח חישובי ובנתוני אימון נרחבים. זהו צעד משמעותי לקראת רובוטים שיתרוממו מכלים מתוכנתים לשותפים אוטונומיים בעלי תבונה מעשית בעולם האמיתי.

מקורות: Google DeepMind
צוות BDNHOST