חזרה לכל החדשות
מאמר מעמיק Academic

מעבר לדוגמה אחת: חשיפת העולם הסמוי של התפלגויות התשובות במודלי שפה

 |  מקור: arXiv cs.AI

כשמשתמש שואל שאלה את ChatGPT או מתחריו, הוא מקבל תשובה אחת. אך מאחורי הקלעים, מודל השפה הגדול (LLM) מייצר למעשה התפלגות הסתברותית שלמה של מיליארדי תשובות אפשריות. המחקר החדש, 'Beyond One Output', שפורסם בשרת arXiv, טוען כי האינטראקציה המצומצמת הזו עם 'דוגמה אחת' מעוותת את הבנתנו את יכולות המודל ומגבילה את השימוש היעיל בו. בעוד הקהילה הטכנולוגית עסוקה בשיפור 'הביצועים הממוצעים', המחברים מצביעים על כך שהערך האמיתי והסיכונים הסמויים טמונים דווקא במבנה ההתפלגותי המלא – במודים (modes) השונים, במקרי הקצה ובשונות הגדולה.

מקורות: arXiv cs.AI
צוות BDNHOST