周一,英偉達(dá)(NVDA.US)首席執(zhí)行官黃仁勛在2023年臺(tái)北電腦展上公布了一批與人工智能(AI)和加速計(jì)算有關(guān)的多項(xiàng)產(chǎn)品及服務(wù)的進(jìn)展。以下為具體信息。
1、大內(nèi)存AI超級(jí)計(jì)算機(jī)DGX GH200
(相關(guān)資料圖)
黃仁勛介紹稱,AI超級(jí)計(jì)算機(jī)DGX GH200集成了英偉達(dá)最先進(jìn)的加速計(jì)算和網(wǎng)絡(luò)技術(shù),旨在為生成式AI語(yǔ)言應(yīng)用、推薦系統(tǒng)、數(shù)據(jù)分析工作負(fù)載開發(fā)大型下一代模型,預(yù)計(jì)今年年底問(wèn)世。
黃仁勛表示,DGX GH200是首款將GH200 Grace Hopper超級(jí)芯片與英偉達(dá)NVLink Switch系統(tǒng)搭配的超級(jí)計(jì)算機(jī),通過(guò)采用新互連方式,將256個(gè)Grace Hopper超級(jí)芯片連接在一起,使它們能像單個(gè)巨型GPU一樣協(xié)同運(yùn)行,從而提供了1EFLOPS的性能和144TB的共享內(nèi)存,較2020年推出的上一代DGX A100 320GB系統(tǒng)的內(nèi)存多出近500倍。
黃仁勛稱,谷歌(GOOG.US)、Meta(META.US)、微軟(MSFT.US)等科技巨頭是首批獲得DGX GH200訪問(wèn)權(quán)限、用于生成式AI工作負(fù)載的公司。此外,英偉達(dá)還打算將DGX GH200設(shè)計(jì)藍(lán)圖提供給云服務(wù)商及其他超大規(guī)模計(jì)算廠商,以便他們可以進(jìn)一步為其基礎(chǔ)設(shè)施定制DGX GH200。
2、GH200 Grace Hopper超級(jí)芯片已全面投產(chǎn)
黃仁勛指出,英偉達(dá)的GH200 Grace Hopper超級(jí)芯片已全面投產(chǎn),將為運(yùn)行復(fù)雜的AI和高性能計(jì)算工作負(fù)載提供動(dòng)力?;贕H200的系統(tǒng)加入了全球系統(tǒng)制造商基于英偉達(dá)最新Grace、Hopper、Ada Lovelace架構(gòu)的400多個(gè)系統(tǒng)配置。位于歐美的幾家全球超大規(guī)模計(jì)算企業(yè)和超算中心客戶將可使用GH200驅(qū)動(dòng)的系統(tǒng)。采用GH200的系統(tǒng)預(yù)計(jì)將于今年晚些時(shí)候上市。
3、大型AI超級(jí)計(jì)算機(jī)NVIDIA Helios
黃仁勛表示,英偉達(dá)正在打造自己的基于DGX GH200的大型AI超級(jí)計(jì)算機(jī)NVIDIA Helios,以支持其研究和開發(fā)團(tuán)隊(duì)的工作。Helios采用4個(gè)DGX GH200系統(tǒng),每個(gè)都將與英偉達(dá)Quantum-2 InfiniBand網(wǎng)絡(luò)連接,帶寬高達(dá)400Gb/s,以提高訓(xùn)練大型AI模型的數(shù)據(jù)吞吐量。Helios將包括1024顆Grace Hopper超級(jí)芯片,將于今年年底上線。
4、NVIDIA Avatar云引擎(ACE)
黃仁勛宣布,推出面向游戲的NVIDIA Avatar云引擎(ACE)。這是一項(xiàng)定制AI模型代工服務(wù),中間件、工具和游戲開發(fā)者可以使用它來(lái)構(gòu)建和部署定制的語(yǔ)音、對(duì)話和動(dòng)畫AI模型。它能賦予非玩家角色(NPC)更智能且不斷進(jìn)化的對(duì)話技能,使其能夠以栩栩如生的個(gè)性來(lái)回答玩家的問(wèn)題。
5、NVIDIA MGX服務(wù)器規(guī)范
為了滿足各種規(guī)模的數(shù)據(jù)中心的需求,黃仁勛發(fā)布了NVIDIA MGX服務(wù)器規(guī)范,為系統(tǒng)制造商提供了模塊化參考架構(gòu)。系統(tǒng)制造商可使用它快速且經(jīng)濟(jì)高效地構(gòu)建100多種服務(wù)器配置,以適應(yīng)廣泛的AI、HPC及NVIDIA Omniverse應(yīng)用。MGX支持英偉達(dá)全系列GPU、CPU、DPU和網(wǎng)絡(luò)適配器,以及各種x86及Arm處理器。其模塊化設(shè)計(jì)使系統(tǒng)制造商能夠更有效地滿足每個(gè)客戶的獨(dú)特預(yù)算、電力輸送、熱設(shè)計(jì)和機(jī)械要求。
永擎(ASRock Rack)、華碩(ASUS)、技嘉(GIGABYTE)、和碩(Pegatron)、QCT、超微(Supermicro)等將采用MGX構(gòu)建下一代加速計(jì)算機(jī),可將開發(fā)成本削減多達(dá)3/4,并將開發(fā)時(shí)間縮短2/3至僅需6個(gè)月。
6、與軟銀合作建立分布式數(shù)據(jù)中心網(wǎng)絡(luò)
黃仁勛還宣布,英偉達(dá)與日本電信巨頭軟銀合作,在日本建立一個(gè)分布式數(shù)據(jù)中心網(wǎng)絡(luò)。它將在一個(gè)共同的云平臺(tái)上提供5G服務(wù)和生成式AI應(yīng)用。數(shù)據(jù)中心將在模塊化MGX系統(tǒng)中使用Grace Hopper、BlueField-3 DPU以及Spectrum以太網(wǎng)交換機(jī),以提供5G協(xié)議所需的高精度定時(shí)。該平臺(tái)將通過(guò)提高頻譜效率來(lái)降低成本,同時(shí)降低能耗。這些系統(tǒng)有助于探索自動(dòng)駕駛、AI工廠、AR/VR、計(jì)算機(jī)視覺和數(shù)字孿生等領(lǐng)域的應(yīng)用。未來(lái)的用途可能包括3D視頻會(huì)議和全息通信。
7、聯(lián)手WPP打造生成式AI內(nèi)容引擎
黃仁勛宣布,全球最大的營(yíng)銷服務(wù)機(jī)構(gòu)英國(guó)WPP集團(tuán)正在與英偉達(dá)合作,在Omniverse Cloud上構(gòu)建首個(gè)生成式AI內(nèi)容引擎,使創(chuàng)意團(tuán)隊(duì)能夠更快、更高效、更大規(guī)模地制作高質(zhì)量的商業(yè)內(nèi)容,同時(shí)與客戶的品牌保持完全一致。基于NVIDIA AI和Omniverse的突破性引擎將來(lái)自領(lǐng)先軟件制造商的創(chuàng)意3D和AI工具連接在一起,以大規(guī)模革新品牌內(nèi)容和體驗(yàn)。
WPP首席執(zhí)行官M(fèi)ark Read表示,生成式AI正以驚人的速度改變營(yíng)銷世界,WPP與英偉達(dá)合作所提供的獨(dú)特競(jìng)爭(zhēng)優(yōu)勢(shì)是當(dāng)今市場(chǎng)上其他客戶無(wú)法獲得的,這項(xiàng)新技術(shù)將改變品牌為商業(yè)用途創(chuàng)建內(nèi)容的方式,并鞏固WPP在為世界頂級(jí)品牌創(chuàng)造性應(yīng)用AI方面的行業(yè)領(lǐng)導(dǎo)者地位。
8、新型加速以太網(wǎng)平臺(tái)NVIDIA Spectrum-X
黃仁勛還宣布推出NVIDIA Spectrum-X,這是一個(gè)旨在提高基于以太網(wǎng)的AI云的性能和效率的網(wǎng)絡(luò)平臺(tái)。它基于網(wǎng)絡(luò)創(chuàng)新,將英偉達(dá)Spectrum-4以太網(wǎng)交換機(jī)與英偉達(dá)BlueField-3 DPU緊密耦合,實(shí)現(xiàn)了相比傳統(tǒng)以太網(wǎng)結(jié)構(gòu)1.7倍的整體AI性能和能效提升,并通過(guò)性能隔離增強(qiáng)了多租戶功能,在多租戶環(huán)境中保持一致、可預(yù)測(cè)的性能。
全球領(lǐng)先的云計(jì)算提供商正在采用Spectrum-X平臺(tái)擴(kuò)展生成式AI服務(wù)。Spectrum-X、Spectrum-4交換機(jī)、BlueField-3 DPU等現(xiàn)已在戴爾、聯(lián)想、超微等系統(tǒng)制造商處提供。