新聞中心

TrendForce: 北美CSP大舉購置NVIDIA GB/Rubin整櫃式方案,2026年AI推論算力將躍升1.2倍


20 May 2026 半導體 TrendForce

根據TrendForce最新AI產業研究,北美五大雲端服務供應商(CSP)為擴大AI訓練和推論應用部署,2026年對整櫃式(rack-scale)AI server的採購意願明顯提高,不僅有望占據全球60%以上的NVIDIA GB/VR需求量,更將同步帶動五大業者總AI訓練算力年增逾56%、總AI推論算力年成長高達122%左右。

TrendForce預估,2026年AI server出貨將年增28%以上,仍以高階AI訓練機種為主力,占比約55%。然中長期內將改由AI推論機種主導,主因是CSP將積極推展AI應用以加速實現AI雲端服務商用化,另像是NVIDIA也將拓展更多AI推論方案或使用情境,包括推動今年主力AI server方案GB/VR系統除AI訓練用途外,也特別強調該方案可支援AI推論相關工作負載。

據TrendForce估計,2026年Google、Amazon、Microsoft、Meta、Oracle的合計資本支出將逾7,700億美元,年增近87%。分析北美五大CSP購置NVIDIA GB/VR系列獲得的運算能力,針對AI訓練部分,若以FP16/BF16為估算基礎,2025年五大業者的總算力達逾9 ExaFLOPS,2026年另將成長56%以上。

針對AI推論,若以FP4/NVFP4運算效能為估算基礎,2025年五大CSP的總算力逾37 ExaFLOPS,預計2026年將大幅成長近122%,顯著高於AI訓練,反映出NVIDIA此次軟硬體系統調校特別著重AI推論效能,並落實在新一代的GB300、VR200整櫃式方案中。

除GPU方案外,CSP業者同步推進自研ASIC整櫃產品,以Google布局最積極。TrendForce預估,2026年Google對自家TPU晶片需求量將年增近80%,並於下半年後將從v7逐漸升級至v8世代。Amazon自研ASIC的力道僅次於Google,預計2026年其Trainium系列於自家AI server占比將達40%以上。

TrendForce表示,NVIDIA、AMD和CSP自研ASIC的新世代機櫃皆整合液冷散熱系統,有助降低AI server的U數(server機架單位),提高單一機櫃可容納的加速器數量。在單顆AI GPU或ASIC的熱設計功耗(TDP)同步提高的情況下,AI server系統功耗呈結構性放大。

據TrendForce估算,2023年北美五大CSP的server功耗合計年增2.8GW,至2026年躍升至18GW,2025至2026年的年成長率高達116%,主因即AI競賽白熱化,NVIDIA GB300、AMD Helios和CSP自研ASIC平台將同步放量。

若有興趣進一步了解並購買 TrendForce 半導體相關研究報告與產業數據,請至 報告頁面 查閱,或 Email (SR_MI@trendforce.com) 洽詢業務。


下一則
TrendForce: QD-OLED面板供應助力,1Q26全球OLED監視器出貨年增78%

聯絡我們


聯絡我們