今日頭條
英偉達下一代GPU,我所知道的全在這了
如果您希望可以時常見面,歡迎標星收藏哦~
下一代 Nvidia Blackwell GPU 架構和 RTX 50 系列 GPU 即將問世,基本符合計劃。雖然 Nvidia 官方沒有透露太多消息,但在過去的一個月里,我們看到該公司圍繞數字 50 發布了大量的營銷材料。一切看起來都有望在CES上發布,很可能是在 1 月 6 日首席執行官黃仁勛的主題演講中。我們預計各種 Blackwell GPU 將加入最佳顯卡的行列,取代即將成為上一代的產品。
當我們在 2024 年初與一些人交談時,他們預計到 2024 年假期到來時,我們至少會看到 RTX 5090 和 RTX 5080。但隨后Blackwell B200 的推遲以及包裝問題,這似乎推遲了事情的發生。現在,我們正在關注 2025 年 1 月的公告,該月底之前至少會有一兩種型號推出,也許會有多達四種不同的臺式機卡——筆記本電腦 RTX 50 系列也有可能。Nvidia 已經提供了其數據中心 Blackwell B200 GPU的許多核心細節。AI 和數據中心變體將不可避免地與消費者部件有所不同,但過去的消費者和數據中心 Nvidia GPU 之間有一些共同點,而且這種情況應該會繼續下去。這為未來 RTX 50 系列 GPU 的某些方面提供了一些很好的跡象。仍有許多未知數,包括硬規格和定價細節。后者可以在最后一刻更改,因此任何定價“泄露”都很可能只是瞎猜,而不是實際信息。另一方面,規格現在應該已經確定,特別是如果我們要在 1 月底之前看到零售可用性的話。讓我們來了解各種謠言和細節,包括發布日期、潛在規格和其他技術。
Blackwell 和 RTX 50 系列發布日期
在所有未知數中,發布日期可能是最容易確定的,尤其是現在。盡管我們個人在 2024 年初就聽說了,但 RTX 50 系列預計將于 2025 年 1 月發布,并在 CES 2025 上亮相。這是一個延遲,但有充分的理由。Nvidia的數據中心 Blackwell B100/B200 GPU 遇到了封裝問題,也被推遲了。考慮到數據中心部門在過去一年中賺了多少錢(參見Nvidia 的最新收益),投入更多資金和晶圓來準備和提供 B200 是有意義的。游戲玩家?是的,我們不再是 Nvidia 的首要任務。
這意味著根據歷史先例,消費者 Blackwell GPU 已經“遲到了”。Ada Lovelace RTX 40 系列 GPU于 2022 年 10 月首次亮相。Ampere RTX 30 系列 GPU于 2020 年 9 月首次亮相。在此之前,RTX 20 系列于兩年前的 2018 年 9 月推出,GTX 10 系列于 2016 年 5 月/6 月推出,GTX 900 系列于 2014 年 9 月推出。這意味著,每兩年就會有新的 Nvidia GPU 架構問世,整整十年如此。即便如此,我們也只比正常節奏晚了幾個月。
這不僅僅是關于兩年的消費級 GPU 節奏。Nvidia于 2022 年 3 月在其年度 GPU 技術大會 上首次披露了Hopper H100 架構的核心細節,Ada Lovelace 將于 2024 年 10 月發布。2020 年 5 月,它首次發布了Ampere A100 架構,幾個月后又發布了消費者版本。2018 年也發生了同樣的事情,當時推出了 Volta V100 和 Turing,2016 年推出了Tesla P100和 Pascal。
因此,在過去四代中,我們首先了解了數據中心和 AI GPU,大約六個月后才發布并推出消費者 GPU。Nvidia 發布了Blackwell B200 架構,如果不是因為那個討厭的 CoWoS 封裝問題,我們可以肯定地說,我們會在 2024 年秋季聽到有關消費者版本的消息。
隨著 Blackwell B200 的完整上市推遲到 2025 年,其他所有產品也都推遲了。人工智能工作負載和銷售正在蓬勃發展,一些地方搶購了數十萬個 Nvidia GPU。這些產品的利潤率遠遠超過任何消費級產品,不過我們仍然可能會看到專業級和數據中心級顯卡使用與消費級型號相同的 GPU。
我們不知道Nvidia 計劃為下一代 Blackwell 部件提供確切的名稱或型號,但我們確信我們將擁有 RTX 5090、RTX 5080、RTX 5070 和 RTX 5060 卡,以及可能是 Ti 和/或 Super 變體的某種組合。毫無疑問,其中一些變體將在首次發布后約一年的中期更新期間推出。我們也很好奇 Nvidia 是否會有 RTX 5050 GPU——它在 40 系列和 20 系列的臺式機 GPU 上跳過了這一級別,盡管后者有 GTX 1660 和 1650 級 GPU。
頂級 RTX 5090 和 5080 應該會率先于 2025 年 1 月上市。有傳言稱我們還可能會看到 RTX 5070 Ti 和 RTX 5070,不過它們是否會在 CES 主題演講期間正式亮相還有待觀察。5060 級硬件可能會在首批 50 系列 GPU 推出后的未來六個月內隨時推出。與往常一樣,我們預計 Blackwell GPU 將遵循典型的交錯發布時間表。
臺積電4NP,精煉4nm Nvidia
GTC 2024 上一個令人驚訝的公告是,Blackwell B200 將使用臺積電 4NP 節點——“4nm Nvidia Performance”,或者基本上是 RTX 40 系列上使用的 N4 節點的調整/微調版本。雖然工藝名稱已經與物理特性基本脫節,但許多人預計 Nvidia 將轉向臺積電尖端 N3 工藝技術的變體。相反,它選擇改進現有的 4N 節點,該節點在過去兩年中已用于 Hopper 和 Ada Lovelace GPU。
走這條路肯定會節省一些成本,盡管臺積電沒有披露與其各個合作伙伴的合同定價協議。Blackwell B200 還使用雙芯片解決方案,兩個相同的芯片通過 10 TB/s NV-HBI連接。也許 Nvidia 只是認為這一代不需要轉向 3nm 級節點。
然而,這為 AMD 甚至英特爾打開了大門,使其有可能轉向更新、更先進的工藝節點,將更高效的晶體管塞進更小的芯片中。Nvidia 對 RTX 30 系列采取了類似的方法,使用更便宜的三星 8N 工藝,而不是更新、更好的臺積電 N7。目前尚不清楚即將推出的下一代 GPU 將如何發展,不過英特爾 Battlemage 至少似乎堅持使用落后節點工藝,因為 Arc B580 使用臺積電 N5——在很多方面都不如 RTX 40 系列先進。
仍有可能雖然 Blackwell B200 變體使用臺積電 4NP,但消費芯片可能會使用不同的節點。這里有使用不同節點甚至制造商的先例,例如 Ampere A100 使用 TSMC N7,而 RTX 30 系列芯片使用三星 8N。但很有可能,所有 Blackwell GPU 都將使用 TSMC N4P。
下一代 GDDR7 內存
人們早就預料到,消費級和專業級 Blackwell GPU 將轉向GDDR7 顯存。所有跡象都表明,GDDR7 將及時為下一代 GPU 做好準備,并且全面生產正在順利進行中。三星和 SK 海力士在 GTC 2024 上展示了 GDDR7 芯片,美光證實 GDDR7 也在生產中。
當前一代 RTX 40 系列 GPU 使用 GDDR6X 和 GDDR6 顯存,主頻從 17Gbps 到 23Gbps。GDDR7 的目標速度高達 36Gbps,比 GDDR6X 高 50%,比普通 GDDR6 高 80%。SK 海力士表示它甚至會有 40Gbps 芯片,盡管尚未給出這些芯片可能上市的具體時間表。無論如何,GDDR7 將在各個級別提供急需的內存帶寬提升。
Nvidia 不太可能真正推出內存頻率為 36Gbps 的顯卡。過去,它使用 24Gbps GDDR6X 芯片,但頻率為 22.4Gbps 或 23Gbps——在我們測試的各種 RTX 4090 顯卡中,一些 24Gbps 的 Micron 芯片顯然被降頻至 21Gbps。目前有跡象表明,RTX 5090 的 GDDR7 頻率將達到 28Gbps,而 RTX 5080 可能會選擇更高的內存速度,達到 32Gbps 或更高。無論哪種方式,這仍然是帶寬的一個健康提升。
在 28Gbps 下,與 RTX 4090 上使用的 21Gbps GDDR6X 相比,GDDR7 內存將提供 33% 的顯存帶寬提升。如果我們的預測正確,并且 RTX 5080 選擇 32Gbps GDDR7,那么與 RTX 4080 Super 相比,帶寬同樣將增加 39%,與原始 4080 的 22.4Gbps 內存相比,帶寬將增加 43%。與 Blackwell 的許多其他方面一樣,Nvidia 及其合作伙伴將推動其發展到何種程度還有待觀察。
我們還預計 Nvidia 將繼續在 Blackwell 中使用大型 L2 緩存。這將提供更有效的內存帶寬——每次緩存命中都意味著不需要進行內存訪問。以 50% 的緩存命中率為例,這將使有效內存帶寬翻倍,但請注意,命中率因游戲和設置而異,尤其是更高的分辨率會降低命中率。
GDDR7 還可能解決內存容量與接口寬度的問題。在 GTC 上,我們被告知 16Gb 芯片正在生產中,24Gb(3GB)芯片也即將推出。容量非 2 的更大芯片是否已為即將推出的 Blackwell GPU 做好準備?至少有傳言稱 Nvidia 可能會推出16GB(2GB 芯片)和 24GB(3GB 芯片)版本的 RTX 5080。只要價格差異不是太大,其他規格保持不變,這不是一個壞方法?;拘吞柨赡芘鋫?2GB 芯片,而升級版本可能配備 3GB 芯片,VRAM 容量增加 50%。
目前,消費級顯卡并不急需超過 24GB 的內存。但據稱 RTX 5090 具有 512 位接口,這意味著它將采用默認的 32GB 配置,未來可能會提供 48GB 版本。容量更大的 GDDR7 芯片可能對專業和 AI 專用顯卡特別有益,因為大型 3D 模型和 LLM 在這些領域越來越常見。512 位接口,PCB 兩側均有 3GB 芯片,可以產生具有 96GB 內存的專業 RTX 6000 Blackwell Generation。
更重要的是,24Gb 芯片的推出意味著 Nvidia可以在 192 位接口上放置 18GB VRAM,在 128 位接口上放置 12GB,在 96 位接口上放置 9GB,所有 VRAM 都位于 PCB 的一側。我們還可以看到 256 位接口的 24GB 顯卡,以及 384 位接口的 36GB 顯卡——專業顯卡的容量是這個數字的兩倍。定價肯定會影響 VRAM 容量,但我們更有可能在消費級 GPU 上看到 24GB GDDR7 內存芯片,而不是“是否”的問題。
Blackwell 架構更新
Blackwell 架構幾乎肯定會包含上一代 Ada Lovelace 架構的各種更新和增強,但現在我們確切知道的內容可以用兩個詞來概括:不多。但每一代 Nvidia GPU 都至少包含一些架構升級,我們可以期待這一輪也會出現同樣的情況。
我們確實知道數據中心 Blackwell B200 GPU 再次重新設計了張量核心,為 FP4 和 FP6 數值格式提供原生支持。這些將主要用于 AI 推理,考慮到消費級 GPU 將與專業卡一起承擔雙重任務,可以肯定所有 Blackwell 芯片也將支持 FP4 和 FP6。
Nvidia 在每一代 RTX 中都提高了潛在的光線追蹤性能,而 Blackwell 似乎可能會延續這一趨勢。隨著《心靈殺手 2》和《賽博朋克 2077》等更多游戲推動全路徑追蹤——更不用說模組制作者可能使用RTX Remix來增強具有全路徑追蹤功能的舊 DX10 時代游戲——對更高光線追蹤吞吐量的需求也隨之增加??赡苓€會有其他以 RT 為中心的更新,就像 Ada 提供的 SER、OMM(不透明度微圖)和 DMM(位移微網格)一樣。但這些變化可能是什么目前尚不清楚。
Blackwell還會帶來哪些其他架構變化?如果我們正確地認為 Nvidia 堅持使用 TSMC 4NP 作為消費級部件,我們預計不會有大規模的改動。仍然會有一個大的 L2 緩存,用于 DLSS 3 幀生成的增強型 OFA當然會保留。它很可能也會進行一些調整以改進它,有傳言稱我們可以在 RTX 50 系列中獲得DLSS 4“神經渲染”。請注意,Nvidia 之前曾將 DLSS 升級和幀生成都稱為“神經渲染”,因此我們需要拭目以待。
對于圖形和更一般的工作負載,原始計算幾乎肯定會大幅增加,但可能更接近 30% 的提升,而不是 50% 或更大的提升。例如,RTX 4080 提供 40 TeraFLOPS 的 FP32 計算,而 3080 為 30 TeraFLOPS,增幅為 33%,而 4090 提供 83 TeraFLOPS,而 3090 為 40 TeraFLOPS,增幅高達 107%。也許 Nvidia 也會在 RTX 5090 上“大展宏圖”,同時在其他方面做出較小的改進,我們很快就會發現答案。
RTX 50 系列定價
RTX 50 系列 GPU 的價格是多少?坦率地說,考慮到目前的市場狀況,幾乎沒有理由指望 Nvidia 會降低相對于當前 RTX 40 系列 GPU 的價格。Nvidia 會將這些顯卡的價格定得盡可能高,只要它認為市場可以接受。由于 AI 性能可能更高,而且非游戲領域的需求增加,如果下一代顯卡的定價結構與當前一代相同,我們可能會很幸運。
我們希望代際定價不會上漲,但這種希望可能落空了?!敖导墶?RTX 4080 Super 售價 1,000 美元意味著特定級別的 GPU 現在比 RTX 2080 Super 時代貴了 43%。
當然,中間還有“699 美元”的 RTX 3080 10GB 和“1,199 美元”的 RTX 3080 Ti,當時由于 GPU 加密挖礦的盛行以及 Covid-19 的影響,價格出現了各種混亂。值得慶幸的是,雖然目前使用 GPU 挖掘某些加密貨幣在技術上是有利可圖的,但WhatToMine估計 RTX 4090 的收入遠低于每天 1 美元——這意味著按照目前的速度和價格,需要十年以上才能收支平衡。
預算 GPU 行業也基本消亡了。集成顯卡已經達到了“足夠快”的程度,可以滿足大多數常見工作負載,甚至包括適度的游戲——對于移動處理器來說尤其如此,而桌面選項通常要弱得多。上一代真正瞄準預算領域的新 GPU 是 AMD 相當不起眼的RX 6500 XT和RX 6400——自2019 年推出GTX 1650 Super以來,Nvidia 還沒有生產過一款低于 200 美元的新 GPU 。
這意味著對于專用的臺式機顯卡,我們現在生活在這樣一個世界里:“預算”意味著 300 美元左右,“主流”意味著 400-600 美元,“高端”是指售價 800 至 1,000 美元的 GPU,而“發燒友”部分的目標是 1,500 美元或更高。或者至少,這似乎是 Nvidia 對這種情況的看法。AMD 的 GPU 往往更實惠一些,尤其是從市場價格來看,但 Nvidia 至少在過去四年里一直保持著較高的定價結構。
Blackwell GPU 上市后價格會好壞參半嗎?如果所有產品的價格都比上一代產品高,請不要感到驚訝,尤其是帶有工廠超頻功能的定制 AIB 合作伙伴型號。未來幾個月價格是否保持高位可能在很大程度上取決于 AI 泡沫是否破裂。如果對 AI 的需求持續增長,那么 RTX 5090 的價格降至 2 美元也不足為奇。499——與舊款Titan RTX一樣。
鑒于我們迄今為止所說的一切,希望可以清楚的是,目前還沒有關于 Blackwell 的任何官方信息。2022年的 Nvidia 黑客攻擊給了我們 Blackwell 這個名字和一些潛在的代號,但那是兩年多前的事了,這段時間里很多事情都可能發生變化。此外,關于 Blackwell 的細節一開始就很少。但現在距離所謂的發布還有幾周的時間,泄密事件也變得更加具體。
這是我們更新的推測規格表,其中包含適當的名稱和規格。官方公告尚未確定任何事情,但下個月推出的任何產品都可能與我們在此處展示的非常相似,我們也會在 GPU 正式發布后更新表格。
半導體精品公眾號推薦
專注半導體領域更多原創內容
關注全球半導體產業動向與趨勢
今天是《半導體行業觀察》為您分享的第3996期內容,歡迎關注。
『半導體第一垂直媒體』
實時 專業 原創 深度
公眾號ID:icbank
喜歡我們的內容就點“在看”分享給小伙伴哦
上一條:斷碳水就是不吃主食?這份科學減重指南請收好
下一條:返回列表
聲明:以上內容為本網站轉自其它媒體,相關信息僅為傳遞更多企業信息之目的,不代表本網觀點,亦不代表本網站贊同其觀點或證實其內容的真實性。投資有風險,需謹慎。