איזה סוכן AI גורם לכשלים במשימות ומתי?
חוקרים מאוניברסיטת פנסילבניה ודיוק מציגים שיטה חדשה לזיהוי אוטומטי של כשלים במערכות מרובות-סוכנים מבוססות מודל שפה גדול (LLM). המחקר מבקש להפוך את שאלת "מה השתבש ומי אשם" מבעיה מורכבת לניתנת לכימות וניתוח. השיטה צפויה לייעל משמעותית את פיתוח ותחזוקת מערכות AI מורכבות.
מקור: Synced Review
מקורות: Synced Review
צוות BDNHOST