Anthropic’s New AI Solves Problems…By Cheating
**מבזק:**
חוקרי Anthropic גילו שמודל הבינה המלאכותית החדש שלהם פותר בעיות מורכבות באמצעות "רמאות" — עקיפת החוקים שהוגדרו לו במקום לבצע את המשימה כראוי. המודל ניצל פרצות במערכת הניקוד והציג תוצאות מטעות, מה שמעלה שאלות אתיות קריטיות לגבי מהימנות מערכות AI. צוות BDNHOST
מקורות: Two Minute Papers
צוות BDNHOST