חזרה לכל החדשות
פוסט Enterprise

צעד ענק נוסף: Nvidia משיקה את האצלן Rubin CPX והראק Oberon

 |  מקור: SemiAnalysis

Nvidia ממשיכה לשנות את כללי המשחק בתעשיית הבינה המלאכותית עם הכרזה כפולה ומשמעותית: האצלן Rubin CPX המותאם ספציפית לשלב ה'פרפייל' (Prefill) בתהליך ההסקה (Inference), ורמת הראק Oberon שהוצגה כבר במרץ. בעוד שההכרזה על הראק בקנה מידה של ארון שלם (Rack-Scale) נחשבה לציון דרך, ה-Rubin CPX מביא אופטימיזציה ממוקדת וחסרת תקדים לשלב קריטי בעומס העבודה של מודלי שפה גדולים (LLMs).

ה-Rubin CPX מייצג גישה חדשה בתכנון חומרה ל-AI. בניגוד לאצלנים כללים יותר, הוא מתוכנן במיוחד לשלב ה'פרפייל' – השלב בו המודל מעבד ומכין את ההקשר (Context) של השאילתה הראשונית. עיצוב זה מדגיש כוח חישובי (FLOPS) על פני רוחב פס זיכרון, החיוני יותר לשלב ה'דקדוק' (Decoding) שבא אחריו. הפרדה זו מאפשרת ביצועים ויעילות חסרי תקדים בעיבוד אצוות (Batches) גדולות של שאילתות מקדימות, צוואר בקבוק מרכזי בהפעלת שירותי AI בקנה מידה.

השילוב בין האצלן הממוקד Rubin CPX לבין ארכיטקטורת הראק Oberon, המחברת 72 שבבי GB200, יוצר מערכת היררכית שלמה לניהול עומסי עבודה של AI. הפרדת המשימות מאפשרת למהנדסים לייעל כל שלב בתהליך ההסקה עם החומרה המתאימה לו ביותר. מהלך זה לא רק משפר דרמטית את הביצועים והיחס בין ביצועים לעלות (Performance per Dollar) עבור ספקי שירותי ענן וחברות גדולות, אלא גם קובע סטנדרט טכני חדש שהמתחרים יצטרכו לעמוד בו. Nvidia מגדירה מחדש לא רק את השבב הבודד, אלא את ארכיטקטורת המערכת כולה עבור עידן ה-AI.

מקורות: SemiAnalysis
צוות BDNHOST