חזרה לכל החדשות
פוסט Enterprise

צעד ענק נוסף: NVIDIA משיקה את מאיץ ה-Rubin CPX והראק המותאם לשלב ה'פרפייל'

 |  מקור: SemiAnalysis

NVIDIA ממשיכה לפרק את תהליך ההסקה (Inference) לגורמים ולבנות עבורו חומרה ייעודית. הכרזת מאיץ ה-Rubin CPX מייצגת מהלך אסטרטגי חד: במקום מאיץ כללי, החברה משיקה פתרון שהותאם במיוחד לשלב ה'פרפייל' (Prefill) בעיבוד מודלי שפה. בשלב זה, המערכת מעבדת את כל הקלט (Prompt) בבת אחת כדי להכין את ההקשר – פעולה הדורשת כוח חישוב עצום אך פחות רוחב פס זיכרון. ה-Rubin CPX, על שבב יחיד, מדגיש בדיוק זאת: FLOPS חישוביים גבוהים מאוד על חשבון רוחב פס הזיכרון, ארכיטקטורה שונה מזו של ה-GPU המסורתי.

המשמעות של מהלך זה עמוקה. עד היום, חברות נאלצו להשתמש באותם שבבים יקרים (כמו ה-H100) הן לשלב ה'פרפייל' החישובי-כבד והן לשלב ה'דקדוק' (Decoding) הרגיש ללטנסיה. פיצול המשימות מאפשר לבנות מערכות יעילות ואפקטיביות יותר בעלות כוללת. ה-Rubin CPX מבטיח להאיץ דרמטית את הזמן needed להכנת התשובה, מה שישפר את חוויית המשתמש בכל אינטראקציה עם בינה מלאכותית – משיחות בצ'אטבוטים ועד ליצירת קוד.

עם זאת, ההכרזה המשמעותית אף יותר היא זו של ראק בקנה מידה מלא, המגיע לאחר ההכרזה על מערכת ה-GB200 NVL72 במרץ 2024. NVIDIA אינה מוכרת עוד רק שבבים בודדים, אלא מערכות שלמות ואופטימיזציות תוכנה ברמת הראק. זהו שינוי פרדיגמה: החברה מציעה ללקוחותיה, בעיקר ענקיות הענן וה-HyperScalers, 'תיבת שחור' מושלמת להסקת בינה מלאכותית, הממקסמת ביצועים תוך הפחתת המורכבות התפעולית. האסטרטגיה הזו מבססת עוד יותר את שליטתה של NVIDIA בשרשרת הערך ומקשה על מתחרות לספק חלופה הוליסטית שכזו.

הכרזת Rubin CPX מסמנת כי המירוץ בתחום החומרה ל-AI עובר ממירוץ גנרי למירוץ של התמחות ואופטימיזציה עבור שלבים ספציפיים בעומס העבודה. זהו אינדיקטור לבגרותו של שוק ההסקה, וקו מנחה לחברות המעוניינות להישאר תחרותיות: הביצועים ייקבעו לא רק על ידי כוח גולמי, אלא על ידי היעילות הספציפית לכל משימה.

מקורות: SemiAnalysis
צוות BDNHOST