6月3日消息,AMD 2023年初發(fā)布的銳龍7040系列(代號(hào)Pheonix),是全球首款集成獨(dú)立NPU AI引擎的x86處理器,基于全新設(shè)計(jì)的XDNA架構(gòu),算力約10TOPS(每秒10萬(wàn)億次浮點(diǎn)運(yùn)算),加上CPU、GPU整體算力約33TOPS,開(kāi)創(chuàng)了AI PC的新時(shí)代。
2023年底的銳龍8040系列(代號(hào)Hawk Point),NPU AI算力一舉提升了60%,達(dá)到約16TOPS,整體算力也提升至39TOPS。
現(xiàn)在,Strix Point終于登場(chǎng)了,官方命名為“銳龍AI 300系列”,架構(gòu)煥然一新,性能也再次飛躍,成為下一代AI PC的基石。
CPU是全新的Zen5架構(gòu),GPU是升級(jí)版的RDNA3.5架構(gòu),NPU是全新的XDNA2架構(gòu),號(hào)稱“面向下代AI PC/Copilot+ PC的世界一流處理器”。
只有制造工藝停留4納米,畢竟非常成熟了。
銳龍AI 300系列首發(fā)只有兩款型號(hào),都定位高端市場(chǎng)。
其中,“銳龍AI 9 HX 370”是頂級(jí)旗艦,CPU部分擁有12核心24線程,多年來(lái)首次在這一定位上提供更多核心,相比銳龍8040系列增加了多達(dá)1/3。
二級(jí)緩存還是每核心1MB,總?cè)萘孔匀辉黾拥?strong>12MB。
三級(jí)緩存終于打破了16MB的“禁錮”,增加了足足一半來(lái)到24MB。
基準(zhǔn)頻率2.0GHz,最高主頻5.1GHz,和現(xiàn)在倒是差不多,但基準(zhǔn)頻率只有2.0GHz。
GPU部分不但升級(jí)架構(gòu),CU單元數(shù)量也從12個(gè)增至16個(gè),命名為“Radeon 890M”,頻率2.9GHz。
NPU部分算力來(lái)到了50TOPS,增加了2倍有余,問(wèn)鼎最強(qiáng)NPU的寶座。
“銳龍AI 9 365”也是高端型號(hào),10核心20線程,二級(jí)緩存10MB,三級(jí)緩存仍為24MB,最高頻率達(dá)5.0GHz,基準(zhǔn)頻率還是2.0GHz。
NPU算力還是50TOPS,GPU部分精簡(jiǎn)為12個(gè)CU單元,改名為Radeon 880M,頻率還是2.9GHz。
TDP熱設(shè)計(jì)功耗都是28W,可調(diào)范圍15~54W。
說(shuō)了這么多,大家也看到了,AMD這一代移動(dòng)處理器采用了全新的命名方式,不再是單純的四位數(shù)字,而是將AI直接加入品牌名,地位之高前所未有。
9 HX、9都是代表產(chǎn)品級(jí)別,但注意這里的HX,和以往高端游戲本處理器用的HX(比如銳龍9 7945HX)不是一回事兒。
數(shù)字編號(hào)采用300系列,代表從NPU單元的角度來(lái)看,這已經(jīng)是第三代AI PC處理器。
以上是一二代XDNA NPU架構(gòu)的對(duì)比圖,可以看到整體布局基本一致,但規(guī)模大大擴(kuò)充。
AI Tile(初代叫AIE Tile)也就是核心的AI計(jì)算引擎模塊,從之前的20個(gè)增加到32個(gè),再加上本身的增強(qiáng)。
Mem Tile也就是本地內(nèi)存模塊,從原來(lái)的5個(gè)增加到8個(gè),可以更好地配合更大規(guī)模的本地調(diào)度、運(yùn)算。
另外,用于互連的交叉總線也從普通的Data Fabric,升級(jí)為Zen/RDNA家族上無(wú)處不在的Infinity Fabric,傳輸帶寬和效率更高。
AMD聲稱,XDNA2 NPU的計(jì)算能力提升了多達(dá)5倍,多任務(wù)并行能力翻了一番,能效也提升了最多2倍。
這里說(shuō)的提升5倍,來(lái)自Llama 2 70億參數(shù)大模型的響應(yīng)速度,從啟動(dòng)到獲得第一個(gè)token,銳龍AI 9 HX 370達(dá)到了銳龍9 8940HS的多達(dá)5倍。
另外非常關(guān)鍵的一點(diǎn),XDNA2首發(fā)引入了全新的Block FP16浮點(diǎn)精度,也就是BFloat16、BF16。它在CPU、GPU上已經(jīng)很常見(jiàn),而在NPU上還是第一次。
傳統(tǒng)的FP8浮點(diǎn)格式性能高而精度不足,F(xiàn)P16浮點(diǎn)格式精度高而性能略遜,而將二者融合起來(lái)的BF16可以在精度、性能上達(dá)到較好的平衡,靈活性也更高。
同時(shí),大多數(shù)AI應(yīng)用都采用了16位精度,因此有了BF16,不再需要量化為8位精度,減少了轉(zhuǎn)換步驟,提高了執(zhí)行效率。
高通驍龍X Elite NPU的算力為45TOPS,Intel即將推出的下一代酷睿Ultra Lunar Lake NPU算力同樣是45TOPS,銳龍AI 300系列則一舉超越二者,成為當(dāng)今最強(qiáng)NPU。
至于蘋(píng)果,M4 NPU的算力只有區(qū)區(qū)38TOPS,還不到Windows陣營(yíng)這邊Copilot+ PC的最低算力需求門(mén)檻40TOPS。
隨著算力的大幅提升,NPU的應(yīng)用也將不再局限于一些持續(xù)性低負(fù)載場(chǎng)景(比如視頻會(huì)議),而是有了更多可能,一方面可以在更多場(chǎng)景中部分取代CPU、GPU,以更高的能效執(zhí)行AI運(yùn)算,大大提升筆記本的續(xù)航能力。
另一方面,更強(qiáng)力的NPU配合更強(qiáng)力的CPU、GPU,可以在更多場(chǎng)景中部署端側(cè)AI,進(jìn)一步擺脫對(duì)云側(cè)的依賴,最大好處就是可以避免隱私泄露和安全威脅。
當(dāng)然,硬件算力再?gòu)?qiáng),也需要生態(tài)應(yīng)用的落地配合。
作為AI PC的先行者,AMD 2024年內(nèi)的ISV合作廠商將超過(guò)150家,既有Adobe、微軟、Topaz Labs這樣的世界級(jí)大廠,也有百川智能、釘釘、、無(wú)問(wèn)芯穹、有道這樣的國(guó)內(nèi)名企,前途不可限量。
當(dāng)然,新一代AI PC的最大亮點(diǎn)就是配合Windows,可以打造全新的Copilot+體驗(yàn),比如歷史回憶、視頻會(huì)議實(shí)時(shí)錄制與翻譯、協(xié)同創(chuàng)作等。
最后是一些官方性能對(duì)比,供參考。
銳龍AI 9 HX 370對(duì)比驍龍X Elite,日常辦公、生產(chǎn)力創(chuàng)作、多任務(wù)、圖形等各方面都遙遙領(lǐng)先,尤其是圖形計(jì)算,驍龍?jiān)谝苿?dòng)端無(wú)敵,但是在AMD面前還是個(gè)弟弟。
對(duì)比Intel目前最好的酷睿Ultra 9 185H,無(wú)論是日常應(yīng)用還是游戲,都已經(jīng)不在一個(gè)級(jí)別上,就看下一代Lunar Lake的表現(xiàn)了。
蘋(píng)果這邊就更不夠看了,尤其是多任務(wù)、3D圖形性能,不在一個(gè)層次上。
銳龍AI 300系列的筆記本將從7月份起陸續(xù)上市,目前已有100多款設(shè)計(jì),涵蓋宏碁、華碩、戴爾、惠普、聯(lián)想、微星等各大主要OEM品牌。
華碩會(huì)在臺(tái)北電腦展上宣布一系列配備銳龍AI 300系列處理器的筆記本,其中輕薄本有16英寸的靈耀(Zenbook S)、14/15/16英寸的無(wú)畏(Vivobook S),創(chuàng)作本有16和13英寸的ProArt P16/X13,游戲本有16英寸的ROG幻系列、14/16英寸的天選系列(TUF GAMING A14/A16)。
微星首批三款,都是16寸大屏機(jī)型,包括面向高端商務(wù)辦公的Summit A16 AI+,輕薄全能游戲型的絕影A16 AI+、主打超薄商務(wù)與創(chuàng)作的尊爵A16 AI+。
芯片圖賞: