חזרה לכל החדשות
פוסט Enterprise

צעד ענק נוסף: אנווידיה משיקה את האצת רובין CPX והראק המותאמים לשלב ה'פרפייל'

 |  מקור: SemiAnalysis

אנווידיה ממשיכה לפרק את תהליך ה'אינפרנס' (ההסקה) לגורמים, ומשיקה היום את פלטפורמת רובין CPX – מערך האצה ייעודי שנועד למטרה אחת: לבצע אופטימיזציה מוחלטת לשלב ה'פרפייל' (Prefill) בעיבוד מודלי שפה גדולים (LLM). בניגוד לשבבים כלליים, ה-Rubin CPX הדו-דיאדי מתמקד בהגדלה קיצונית של כוח החישוב (FLOPS) על חשבון רוחב הפס של הזיכרון, תכנון שמתאים בדיוק לאופי העבודה הסדרתי והאינטנסיבי של שלב הכנת הקונטקסט הראשוני.

החשיבות של מהלך זה משתווה רק להכרזת מערכת הראק-סקייל GB200 NVL72 Oberon בחודש מרץ. בעוד שאוברון תוכנן כפלטפורמת על לשלב ה'דקודינג' (Decoding) – שלב יצירת התגובה הרציף – רובין CPX הוא התשובה המקבילה לשלב הראשון והקריטי. פיצול האדריכלות מאפשר ללקוחות לבנות תשתית הטרוגנית שבה כל שלב מבוצע על החומרה היעילה ביותר עבורו, מה שמבטיח חיסכון עצום בעלויות האנרגיה והחישוב בקנה מידה של דאטה-סנטר.

המשמעות עבור תעשיית הבינה המלאכותית היא מעבר מגישת 'שבב אחד לכל המשימות' לארכיטקטורה מפוצלת (Disaggregated). מהלך זה אינו רק טכני; הוא מסמן את הבשלתה של שוק ההסקה והופעתם של 'מקצועות' ספציפיים בתוך צינור העיבוד. חברות המפעילות מודלים בקנה מידה גדול, כמו ספקיות ענן ומפתחי מודלים, יוכלו כעת לייעל את התשתית שלהן בצורה חסרת תקדים, להאיץ זמני תגובה ולצמצם את ה-TCO (העלות הכוללת של הבעלות).

עם הכרזת רובין, אנווידיה לא רק משמרת את היתרון שלה, אלא למעשה יוצרת קטגוריה חדשה של חומרה ייעודית בתוך תחום ה-AI. המרוץ להאצת האינפרנס נכנס כעת לשלב חדש של התמחות ועידון, שעשוי לקבוע את המבנה והכלכלה של דאטה-סנטרים בעשור הקרוב.

מקורות: SemiAnalysis
צוות BDNHOST