NVIDIA與(yǔ)全(quán)球合作(zuò)夥伴聯合發(fà)布(bù)全(quán)新(xīn)HGXA100系(xì)統。

 行業动态     |      2022-05-30 14:41:31    |      瀝拓

ISC-NVIDIA今天(tiān)宣布(bù),将人(rén)工智能(néng)與(yǔ)高(gāo)性(xìng)能(néng)计算相結合的(de)新(xīn)技術(shù)應(yìng)用(yòng)于(yú)NVIDIAHGXAI超級计算平台(tái),使越来(lái)越多(duō)的(de)行業能(néng)夠更(gèng)充分(fēn)地(dì)利用(yòng)超級计算的(de)力量(liàng)。

为了(le)加快(kuài)工業人(rén)工智能(néng)和(hé)HPC新(xīn)时(shí)代(dài)的(de)到(dào)来(lái),NVIDIA在(zài)HGX平台(tái)上(shàng)增加了(le)三(sān)项關(guān)鍵技術(shù):NVIDIA10080GBPCIEGPU、NVIDIANDR400GInfininiband网(wǎng)络和(hé)NVIDIAMagnumiOGPUDirectStorage软(ruǎn)件(jiàn)。为實(shí)現(xiàn)工業HPC的(de)創新(xīn),三(sān)者(zhě)結合提(tí)供了(le)卓越的(de)性(xìng)能(néng)。

目前(qián),數十(shí)家(jiā)合作(zuò)夥伴已将NVIDIAHGX平台(tái)應(yìng)用(yòng)于(yú)新(xīn)一(yī)代(dài)系(xì)統和(hé)解(jiě)決方(fāng)案(àn),包(bāo)括源訊(Atos)、戴尔科技(Deltechnologies)、彙和(hé)(Hewletpackardenterprise)、聯想(xiǎng)(Lenovo)、Microsoftazure、Netapp等。

NVIDIA創始(shǐ)人(rén)兼首席(xí)執行官黃仁勳先(xiān)生(shēng)说(shuō):HPC革(gé)命始(shǐ)于(yú)學(xué)術(shù)界,並(bìng)迅速擴展(zhǎn)到(dào)各(gè)行各(gè)業。行業的(de)關(guān)鍵趨勢正(zhèng)在(zài)促進(jìn)超級指數和(hé)超摩尔定(dìng)律的(de)發(fà)展(zhǎn),使HPC成(chéng)为各(gè)行業的(de)工具。NVIDIA的(de)HGX平台(tái)为研究人(rén)員提(tí)供了(le)優秀的(de)高(gāo)性(xìng)能(néng)计算加速能(néng)力,以解(jiě)決行業面(miàn)臨的(de)最(zuì)困难的(de)問(wèn)题。

行業領導者(zhě)利用(yòng)HGX平台(tái)推动創新(xīn)突破。

HGX平台(tái)是(shì)高(gāo)科技産業的(de)先(xiān)驅,将HPC創新(xīn)應(yìng)用(yòng)于(yú)计算流體(tǐ)动力學(xué)模拟,以指導大(dà)型燃气(qì)轮机和(hé)噴气(qì)發(fà)动机的(de)設计和(hé)創新(xīn)。HGX平台(tái)在(zài)通(tòng)用(yòng)電(diàn)气(qì)的(de)GENESIS代(dài)碼中(zhōng)實(shí)現(xiàn)了(le)突破性(xìng)CFD方(fāng)法(fǎ)的(de)數量(liàng)級加速。該代(dài)碼采用(yòng)大(dà)渦模拟来(lái)研究渦轮机內(nèi)部(bù)湍流的(de)影響。渦轮机由(yóu)數百(bǎi)个(gè)單獨的(de)葉(yè)片组成(chéng),需要(yào)獨特(tè)而(ér)複雜的(de)幾(jǐ)何形狀。

HGX平台(tái)除了(le)促進(jìn)工業HPC轉(zhuǎn)型外(wài),還(huán)在(zài)加快(kuài)世界各(gè)地(dì)的(de)科學(xué)HPC系(xì)統,包(bāo)括爱(ài)丁堡大(dà)學(xué)的(de)新(xīn)一(yī)代(dài)超級计算机。

NVIDIA10080GBPCIEGPU提(tí)升(shēng)AI和(hé)HPC性(xìng)能(néng)。

NVIDIAA100TensorcoreGPU提(tí)供了(le)前(qián)所(suǒ)未有(yǒu)的(de)HPC加速能(néng)力,解(jiě)決了(le)與(yǔ)工業HPC相關(guān)的(de)複雜人(rén)工智能(néng)、數據(jù)分(fēn)析、模型培訓和(hé)计算模拟等挑战。A10080GBPCIEGPU的(de)內(nèi)存带(dài)宽(kuān)比A10040GB增加25%,达(dá)到(dào)2TB/s,並(bìng)提(tí)供80GBHBM2e高(gāo)带(dài)宽(kuān)內(nèi)存。

A10080GBPCIE的(de)巨大(dà)內(nèi)存容量(liàng)和(hé)高(gāo)內(nèi)存带(dài)宽(kuān)可(kě)以保存更(gèng)多(duō)的(de)數據(jù)和(hé)更(gèng)大(dà)的(de)神經(jīng)网(wǎng)络,從而(ér)最(zuì)大(dà)限度(dù)地(dì)减少(shǎo)节(jié)點(diǎn)間(jiān)的(de)通(tòng)信(xìn)和(hé)能(néng)耗。随着內(nèi)存带(dài)宽(kuān)的(de)加快(kuài),研究人(rén)員可(kě)以獲得更(gèng)高(gāo)的(de)吞吐量(liàng)和(hé)更(gèng)快(kuài)的(de)結果(guǒ),最(zuì)大(dà)化(huà)IT投資價值。

A10080GBPCIEGPU基于(yú)NVIDIAMPere架構。該架構內(nèi)置Multi-InstanceGPU(MIG)功能(néng),可(kě)加速AI推理(lǐ)等小工作(zuò)負载(zài)。MIG允许HPC系(xì)統縮小计算和(hé)內(nèi)存規模,同(tóng)时(shí)保證服(fú)務(wù)質(zhì)量(liàng)。除PCIE外(wài),還(huán)有(yǒu)NVIDIAHGXA100配置4卡和(hé)8卡。

NVIDIA合作(zuò)夥伴为A10080GBPCIEGPU提(tí)供了(le)廣泛的(de)支持(chí),包(bāo)括源訊(Atos)、思(sī)科(Cisco)、戴尔科技(Delltechnologies)、富士通(tòng)(Fujitsu)、新(xīn)華三(sān)(H3C)、彙和(hé)(Hewlettpackardenterprise)、浪潮(cháo)(Inspur)、聯想(xiǎng)(Lenovo)、Penguincomputing、雲(yún)达(dá)科技(QCT)和(hé)超微(Supermicro)。基于(yú)A100GPU的(de)HGX平台(tái)也(yě)可(kě)以通(tòng)过(guò)AWS(AmazonWebservices)、Microsoftazure和(hé)Oracleclecloudinfrastericture雲(yún)服(fú)務(wù)獲得。

新(xīn)一(yī)代(dài)NDR400gb/sinfininiband交換机系(xì)統。

NVIDIAInfiniband是(shì)世界上(shàng)唯一(yī)一(yī)个(gè)具有(yǒu)完全(quán)卸载(zài)功能(néng)的(de)网(wǎng)络计算互聯系(xì)統,为需要(yào)超大(dà)數據(jù)通(tòng)道的(de)HPC系(xì)統提(tí)供超級支持(chí)。NDRInfiniband网(wǎng)络可(kě)以輕(qīng)松擴展(zhǎn)性(xìng)能(néng),應(yìng)对工業HPC和(hé)科學(xué)HPC系(xì)統面(miàn)臨的(de)諸多(duō)挑战。基于(yú)NVIDIAQuantum-2芯片的(de)交換机系(xì)統可(kě)提(tí)供64个(gè)NDR400Gb/sinfininiband端口(或(huò)128个(gè)NDR200端口),其(qí)端口密度(dù)是(shì)HDRinfininiband的(de)3倍。

NVIDIAQuantum-2模块(kuài)化(huà)交換机提(tí)供可(kě)擴展(zhǎn)的(de)端口配置選项,最(zuì)高(gāo)可(kě)提(tí)供2048个(gè)NDR400gb/sinfiniband端口(或(huò)4096个(gè)NDR200端口),双(shuāng)向(xiàng)總(zǒng)吞吐量(liàng)达(dá)到(dào)1.64Pb/s,是(shì)上(shàng)一(yī)代(dài)HDRinfiniband模块(kuài)化(huà)交換机系(xì)列的(de)5倍。與(yǔ)上(shàng)一(yī)代(dài)相比,这(zhè)款2048端口交換机的(de)擴展(zhǎn)能(néng)力提(tí)高(gāo)了(le)6.5倍。使用(yòng)Dragonfly+网(wǎng)络拓扑,只(zhī)需三(sān)个(gè)网(wǎng)络Hop即可(kě)連(lián)接100多(duō)万(wàn)个(gè)节(jié)點(diǎn)。第(dì)三(sān)代(dài)NVIDIASHARP网(wǎng)络计算數據(jù)歸约技術(shù)比上(shàng)一(yī)代(dài)AI加速能(néng)力提(tí)高(gāo)了(le)32倍,可(kě)以大(dà)大(dà)提(tí)高(gāo)高(gāo)性(xìng)能(néng)産業和(hé)科學(xué)應(yìng)用(yòng)的(de)性(xìng)能(néng)。

此(cǐ)外(wài),NVIDIAUFMCyber-AI平台(tái)還(huán)提(tí)供了(le)先(xiān)進(jìn)的(de)管(guǎn)理(lǐ)功能(néng),如(rú)网(wǎng)络自(zì)修複功能(néng)和(hé)NVIDIA网(wǎng)络计算加速引擎,以進(jìn)一(yī)步减少(shǎo)數據(jù)中(zhōng)心的(de)停机时(shí)間(jiān)。

基于(yú)行業标(biāo)準的(de)NVIDIAQuantum-2交換机(預计年(nián)底前(qián)向(xiàng)後(hòu)和(hé)向(xiàng)前(qián)的(de)兼容性(xìng),可(kě)以輕(qīng)松遷移和(hé)擴展(zhǎn)現(xiàn)有(yǒu)的(de)系(xì)統和(hé)软(ruǎn)件(jiàn)。

包(bāo)括源訊(Atos)、DDN、戴尔科技(Delltechnologies)、Excelero、技嘉科技(GIGABYTE)、彙和(hé)(HPE)、聯想(xiǎng)(Lenovo)、Penguincomputing、雲(yún)达(dá)科技(QCT)、超微(Supermicro)、VAST、Wekaio等。此(cǐ)外(wài),包(bāo)括Azure在(zài)內(nèi)的(de)雲(yún)服(fú)務(wù)提(tí)供商也(yě)在(zài)使用(yòng)Infiniband技術(shù)。

MagnumiogpudirectStorage介紹。

MagnumioGPUDirectStorage提(tí)供GPU內(nèi)存和(hé)存儲之(zhī)間(jiān)的(de)直(zhí)接內(nèi)存訪問(wèn),實(shí)現(xiàn)了(le)優异(yì)的(de)複雜工作(zuò)負载(zài)處(chù)理(lǐ)性(xìng)能(néng)。这(zhè)種(zhǒng)直(zhí)接通(tòng)道有(yǒu)利于(yú)應(yìng)用(yòng)程序從低(dī)I/O延遲中(zhōng)受益,充分(fēn)利用(yòng)网(wǎng)卡的(de)所(suǒ)有(yǒu)带(dài)宽(kuān),减少(shǎo)CPU在(zài)通(tòng)信(xìn)中(zhōng)的(de)負载(zài),管(guǎn)理(lǐ)數據(jù)消耗逐漸增加的(de)影響。