מאמר מעמיק Academic

אשליית השימוש המופרז בכלים: מדוע מודלי שפה גדולים מעדיפים כלים חיצוניים על פני ידע פנימי?

23.04.2026 | מקור: arXiv cs.AI

מחקר חדש שפורסם ב-arXiv חושף תופעה מטרידה בעולם הבינה המלאכותית (AI): מודלי שפה גדולים (LLMs) נוטים להשתמש בכלים חיצוניים גם כאשר הם מחזיקים בידע הדרוש לענות על השאלה בעצמם. תופעה זו, המכונה "שימוש מופרז בכלים" (Tool Overuse), מעלה שאלות מהותיות לגבי האופן שבו אנו מתכננים ומטמיעים מערכות AI בעולם האמיתי.

החוקרים בחנו מגוון רחב של מודלים, החל מ-GPT-4 ועד למודלים פתוחי קוד כמו LLaMA, ומצאו כי התופעה אינה מוגבלת למודל מסוים אלא נרחבת ומערכתית. המודלים פנו למחשבונים, מנועי חיפוש או מסדי נתונים חיצוניים גם עבור שאלות פשוטות כמו "מהי עיר הבירה של צרפת?" או "כמה זה 2+2?" – מידע שהיה זמין להם במלואו במאגרי הידע הפנימיים שאומנו עליהם.

המחקר מתעמק במנגנונים העומדים מאחורי תופעה זו באמצעות שני נדבכים מרכזיים: ראשית, ניתוח התנהגות השימוש בכלים ביחס לרמות שונות של ידע פנימי במודל; שנית, בחינת הארכיטקטורה של המודל עצמו, בעיקר מנגנון הקשב (Attention) והדרך שבו הוא מחליט בין אחזור מידע פנימי לבין שימוש בכלים חיצוניים.

הממצאים מראים כי המודלים מפתחים מעין "עצלות קוגניטיבית" (Cognitive Laziness) באימונם: כאשר כלי חיצוני זמין, המודל מעדיף את המסלול הקצר והקל של קריאה לחיצונית על פני עיבוד מעמיק של הידע הפנימי. זה דומה לתלמיד שמשתמש במחשבון במקום לחשב בראש – גם כשהוא יודע את התשובה.

ההשלכות של תופעה זו משמעותיות ביותר עבור תעשיית הבינה המלאכותית. ראשית, שימוש מופרז בכלים מגדיל את העלויות התפעוליות של מערכות AI, שכן כל קריאה לכלי חיצוני כרוכה בעלויות זמן ומשאבי מחשוב. שנית, הוא מגביר את התלות בתשתיות חיצוניות, מה שפוגע באמינות ובזמינות של המערכת.

מבחינה טכנית, החוקרים מצאו כי תופעת השימוש המופרז בכלים קשורה באופן הדוק למנגנון הכיול (Calibration) של המודל. כאשר מודל אינו מכויל כראוי, כלומר אינו מסוגל להעריך במדויק את הביטחון שלו בידע הפנימי, הוא פונה לכלים חיצוניים כפתרון ברירת מחדל. זה יוצר מעגל קסמים: ככל שהמודל משתמש יותר בכלים, כך הוא מאמן את עצמו להיות פחות תלוי בידע הפנימי.

אחת הדוגמאות המעניינות במחקר היא המקרה של שאלות מתמטיות. המודלים הפגינו נטייה חזקה במיוחד להשתמש במחשבון חיצוני, גם עבור חישובים פשוטים כמו חיבור של שני מספרים חד-ספרתיים. החוקרים משערים כי האימון על נתונים המכילים שימוש תכוף בכלים חינוכיים (כמו מחשבונים) יצר אסוציאציה חזקה בין שאלות מתמטיות לשימוש בכלים.

המחקר מציע גם מספר פתרונות אפשריים לתופעה. בין היתר, מוצעים מנגנוני ויסות דינמיים שיאזנו בין שימוש בכלים לידע פנימי, שיפור טכניקות הכיול של מודלים, והכנסת פאזת "הרהור" (Reflection) שבה המודל בודק את הידע הפנימי שלו לפני שהוא פונה לכלים חיצוניים.

מבחינה פרקטית, המחקר מדגיש את הצורך בתכנון זהיר של מערכות AI משולבות כלים (Tool-Augmented LLMs). מפתחים צריכים לשקול לא רק את הפונקציונליות של הכלים, אלא גם את ההשפעה על הרגלי העבודה הפנימיים של המודל. איזון נכון בין שימוש בכלים לידע פנימי הוא המפתח ליצירת מערכות AI יעילות וחסכוניות.

מקור: arXiv cs.AI (arXiv:2604.19749v1)

צוות BDNHOST

מקורות: arXiv cs.AI

צוות BDNHOST