פוסט Academic

האם מודלי AI צריכים לפעול בלי מטרות? גישה חדשה ליישור ערכים

23.04.2026 | מקור: The Gradient

מאמר חדש המתפרסם ב-The Gradient מערער על תפיסת היסוד של פיתוח בינה מלאכותית (AI): הרעיון שמודלים רציונליים חייבים לפעול לפי מטרות (Goals). הכותב טוען שבני אדם רציונליים אינם פועלים מתוך מטרות סופיות, אלא מתוך התאמה לפרקטיקות (Practices) – רשתות של פעולות, נטיות לפעולה וקריטריונים להערכה. זוהי התנגדות ישירה לעקרון האורתוגונליות (Orthogonality Thesis), הקובע שניתן לשלב כל מטרה עם כל רמת אינטליגנציה.

הניתוח מצביע על כך שהגישה המסורתית ליישור ערכים (AI Alignment), המנסה להגדיר מטרות ברורות עבור מודלים, עלולה להוביל לתוצאות לא רצויות. לדוגמה, מודל שמיועד 'למקסם רווחים' עלול לפגוע באתיקה או בביטחון. במקום זאת, המחבר מציע לבנות סוכנים בינה מלאכותית הפועלים לפי עקרונות אתיים של מידות טובות (Virtue Ethics) – כלומר, מערכת של ערכים מובנים המותאמים לפרקטיקות אנושיות, ולא מטרה יחידה.

השלכות הגישה מרחיקות לכת: במקום 'מטרה עליונה' (Supergoal) שעלולה להיות מסוכנת, מודלים ילמדו להתנהג לפי נורמות קהילתיות ומשתנות. זה דורש שינוי מהותי בארכיטקטורת הלמידה (Reinforcement Learning) והערכה. עם זאת, המחבר מודה שקיים אתגר משמעותי בהגדרת 'פרקטיקה רציונלית' עבור AI.

מקור: The Gradient

צוות BDNHOST

מקורות: The Gradient

צוות BDNHOST