頂點(diǎn)光電子商城2024年9月26日消息:近日,英特爾AI Gaudi 3加速器是英特爾發(fā)布的新一代AI加速器,它在性能、性價(jià)比以及技術(shù)規(guī)格上均實(shí)現(xiàn)了顯著提升,成為AI算力領(lǐng)域的一顆新星。
Gaudi 3采用了臺(tái)積電最新的5nm制程工藝,相比上一代的7nm工藝,能效比得到大幅提升。從原來的2個(gè)增加到8個(gè),每個(gè)MME內(nèi)部的張量處理核心(TPC)數(shù)量從12個(gè)減少到8個(gè),但總數(shù)從24個(gè)大幅增加到了64個(gè),顯著提升了運(yùn)算能力。數(shù)量從8個(gè)增加至14個(gè),增強(qiáng)了視頻和圖像處理能力。容量翻倍至96MB,帶寬也翻倍至12.8TB/s,為大規(guī)模數(shù)據(jù)處理提供了強(qiáng)有力的支持。
Gaudi 3容量從96GB增加到了128GB,帶寬提升至3.7TB/s,支持高吞吐量數(shù)據(jù)處理。設(shè)有24個(gè)200Gb RDMA網(wǎng)絡(luò)接口,雙向網(wǎng)絡(luò)帶寬達(dá)到1.2TB/s,主機(jī)接口峰值雙向帶寬為128GB/s,系統(tǒng)總線升級(jí)至PCIe 5.0 x16,為大規(guī)模并行計(jì)算提供了堅(jiān)實(shí)基礎(chǔ)。在BF16和FP8格式下,MME的計(jì)算性能達(dá)到1835 TFlops(每秒1.835億億次運(yùn)算),相比前一代有顯著提升。在矢量BF16格式下,峰值性能為28.8 TFlops(每秒28.8萬億次),同樣實(shí)現(xiàn)了性能飛躍。
Gaudi 3在性價(jià)比方面表現(xiàn)突出,據(jù)官方數(shù)據(jù),其性價(jià)比達(dá)到了NVIDIA H100的兩倍。在大模型的推理性能上,Gaudi 3相比NVIDIA H100領(lǐng)先50%,訓(xùn)練時(shí)間則縮短了40%。這一優(yōu)勢(shì)使得Gaudi 3在AI硬件市場(chǎng)上具有極強(qiáng)的競(jìng)爭(zhēng)力。
Gaudi 3的發(fā)布不僅加劇了AI硬件市場(chǎng)的競(jìng)爭(zhēng),也為企業(yè)級(jí)應(yīng)用、云計(jì)算和AI訓(xùn)練領(lǐng)域帶來了新的動(dòng)力與可能性。例如,IBM已在其云服務(wù)中部署了Gaudi 3加速器,預(yù)計(jì)將對(duì)行業(yè)帶來深遠(yuǎn)影響。此外,還有傳聞稱Gaudi 3將推出專為中國(guó)市場(chǎng)量身定制的版本,以滿足不同市場(chǎng)的需求。