Vera Rubin让AI晶片从单颗CPU进入机架级系统架构的时代,透过六颗不同功能的晶片高度分工、彼此协同运作,确保GPU几乎不会被非计算任务给打断,形成一个高稳定且高效率的运算管道。若与Blackwell相比,Vera Rubin的推理成本能降低约十倍之多。
本周三出刊的《先探投资周刊》2393期就以当前强势族群紧扣著AI基础设施的核心议体,特别是机构法人高度期待辉达下一代Rubin平台架构能够带来的效益,同时也紧扣著辉达执行长黄仁勋将在下个月的GTC大会发表一颗未曾亮相的晶片,所以延伸出AI硬体的周边,像是高效能运算ABF载板,受惠于小晶片架构带来的层数与面积增长,还有电子级玻纤布与玻纤纱在低介电规格升级下迎来库存回补与技术红利,当然更不能错过记忆体产业的话题,这些累积已久的买盘一次性爆发,象征著台湾电子产业从传统代工正式蜕变为全球算力供应链的核心。
Nvidia执行长在今年CES展中首度揭露次世代AI运作系统,正式发表Vera Rubin,预计下半年上市,这款AI运作系统标志AI运算正式进入rack-scale system engineering(机架级系统架构时代)。与过去单颗GPU演进不同,Rubin并非单一晶片升级,而是由六颗高度分工、彼此协同的关键晶片所组成,共同构成一个完整的AI工厂。Rubin架构的核心不仅来自于GPU算力提升,而在于计算、互连、网路以及全面提升基础设施的效率。
这座系统架构透过Vera CPU、Rubin GPU、NVLink 6、ConnectX-9、BlueField-4与Spectrum-6的协同,Nvidia得以在同等或可控功耗,降低AI训练与推理成本,建立难以复制的系统级护城河。如果和Blackwell相比,Vera Rubin的推理成本能降低约十倍,训练与推理效率提升,在同等的功率下有更高的效能。
很多消息来源指出,Rubin NVL72系统推论性能可以达到Blackwell的五倍。Rubin GPU本身具备50peraflops NVFP4 AI推理能力,这里的50peraflops指的是单颗Rubin GPU每秒能进行五万兆次运算的算力单位,NVFP4则是Nvidia开发的四位元浮点数格式。
传统AI运算常用十六位元,位元数愈低,运算愈快且节省记忆体。Vera Rubin虽然只用到四位元,但透过Nvidia的技术优化,它能保持接近十六位元或八位元的高精确度,同时让推理速度翻倍,这就是Nvidia黑科技能力。
采用台积电三奈米制程
在功耗上,Nvidia并没有公开具体功耗瓦数数据,但从推理/瓦效与系统整合推测,Rubin平台在能源效率上远优于Blackwell架构。当然,这与台积电先进制程有关。
Blackwell GPU采用台积电四奈米制程,而Vera Rubin的六款晶片全都采用台积电三奈米制程,并采用台积电的CoWoS-L封装技术,并首度导入Chiplet(小晶片)设计与四倍光罩尺寸设计,将首度搭载HBM4记忆体,频宽可达22TB/s。显然台积电的先进制程与封装技术,是Vera Rubin晶片能提升运作效率又能降低功耗很重要的原因。
台积电的先进制程一直供不应求,虽然今年的资本支出将达到五二○~五六○亿美元,主要是用在二奈米建厂以及先进封装厂上,但需求实在太大,台积电正扩大封测委外布局,日月光投控和京元电子要的受惠转单对象,欣铨与力成也有可能受惠外溢订单。台积电七奈米以下先进制程营收比重已达七四%,这类高端晶片的后段封测需求接挹注给日月光(封装)与京元电(测试),带动这两家公司资本支出和业绩的成长。
日月光投控已明确表示将积极追赶客户需求,并大幅调升投资规模,以维持先进封装龙头的地位。该公司规划今年整体资本支出将达到七○亿美元创新高。其中机器设备会比去年的三四亿美元,再增加十五亿美元,成长幅度达三成。整体资本支出项目中约有三分之二会用在先进制程的支出上;日月光投控预计先进封装服务(LEAP)营收将从去年的十六亿美元,翻倍到三二亿美元。
测试大厂的京元电子也受惠于Nvidia AI晶片需求超乎预期,且AI晶片设计趋于复杂,导致测试时间拉长与需求增加,AI晶片需要更精细的系统级测试(SLT)与烧机测试(Burn-in),带动产能持续满载,京元电子今年的资本支出将接近四百亿台币,续创历史新高。
本文完整报导、发烧个股动态,以及更多第一手台股投资讯息,请见先探投资周刊2393期。
如没特殊注明,文章均来源于互联网,版权归原创作者所有,如有侵权,请联系我们处理!

