Where the goblins came from
חוקרים זיהו תופעה חדשה במודל GPT-5 של OpenAI: פלטים "גובליניים" (goblin outputs) – תגובות לא צפויות בעלות אופי אישיותי שגוי, שנובעות מליקויים בהתאמת ההנחיות (prompt alignment) בשלבי האימון המוקדמים. התיקונים כוללים כיול מחדש של שכבות הפלט וכיוונון עדין (fine-tuning) משופר לזיהוי התנהגויות חריגות.
מקור: 6 מקורות
מקורות:
צוות BDNHOST