Rubin CPX與全新 NVIDIA Vera Rubin NVL144 CPX 平台中的 Vera CPU、Rubin GPU 協同運作,單一機架具備高達 8 exaflops AI 運算能力,比 GB300 NVL72 系統效能提升 7.5 倍,並配備 100TB 快速記憶體與 每秒 1.7PB 記憶體頻寬。同時,NVIDIA 也提供專屬運算托盤,方便現有客戶升級。

NVIDIA 創辦人暨執行長黃仁勳指出,Rubin CPX 是首款專為長情境 AI 打造的 CUDA GPU,如同當年 RTX 改變圖形運算,Rubin CPX 將徹底改寫 AI 模型推理方式,能處理數百萬詞元的任務。這項技術突破將讓 AI 從單純生成程式碼,演進為可理解並最佳化大型軟體系統的工具。

Rubin CPX 將影片解碼器、編碼器與長情境推論處理技術整合至單一晶片,解決傳統 GPU 無法承受的百萬詞元瓶頸。這對影片搜尋、長格式生成與動態影像分析等應用帶來全新可能。NVIDIA 表示,Rubin CPX 可在處理長情境時提供最高詞元收益與效能,為 AI 助理、影片生成與多模態代理奠定基礎。

該 GPU 採 單晶片 Rubin 架構,搭載 NVFP4 運算資源,效能可達 30 petaflops,並配置 128GB GDDR7 記憶體,大幅提升能源效率與經濟性。與 GB300 NVL72 相比,Rubin CPX 能將系統專注力提升 3 倍,讓模型在不犧牲速度下處理更長的情境序列。

Rubin CPX 提供多種平台組合,包含 InfiniBand 橫向擴展架構與 Spectrum-X 乙太網路平台。官方估算,企業透過 Rubin CPX,每投資 1 億美元可獲得 50 億美元詞元收益。

Rubin CPX 將獲得 NVIDIA AI 技術堆疊全面支援,包括 NVIDIA Dynamo 平台、Nemotron 多模態模型、AI Enterprise 軟體平台與 NIM 微服務。NVIDIA 表示,企業可將 Rubin CPX 應用於雲端、資料中心與工作站,支援最先進的推理與生成工作負載。

Rubin 平台延續 CUDA 生態優勢,結合 600 萬名開發者社群與 6,000 種 CUDA 應用,擴大 GPU 在長情境 AI、影片生成與軟體工程的核心地位。NVIDIA 強調,Rubin CPX 不僅是一款 GPU,更是推動「長情境 AI 時代」的全新處理器類別。