加州圣克(kè)拉拉–GTC2020–2020年(nián)5月(yuè)14日(rì)–NVIDIA今天(tiān)宣布(bù)首款基于(yú)NVIDIA®Ampere架構的(de)GPU——NVIDIAA100已全(quán)面(miàn)投産,並(bìng)已交付給(gěi)全(quán)球客戶。
A100采用(yòng)了(le)NVIDIAAmpere建築的(de)突破性(xìng)設计,設计为NVIDIA第(dì)八代(dài)GPU它(tā)提(tí)供了(le)迄今为止最(zuì)大(dà)的(de)性(xìng)能(néng)飛躍,集成(chéng)AI訓练與(yǔ)推理(lǐ)相結合,其(qí)性(xìng)能(néng)比上(shàng)一(yī)代(dài)産品高(gāo)20倍。作(zuò)为一(yī)種(zhǒng)通(tòng)用(yòng)工作(zuò)加速器,A100還(huán)設计用(yòng)于(yú)數據(jù)分(fēn)析、科學(xué)计算和(hé)雲(yún)图(tú)形。
NVIDIA創始(shǐ)人(rén)兼CEO黃仁勳说(shuō):“雲(yún)计算和(hé)AI強(qiáng)勁的(de)趨勢正(zhèng)在(zài)推动數據(jù)中(zhōng)心設计的(de)結構轉(zhuǎn)型,过(guò)去(qù)是(shì)純粹的(de)CPU服(fú)務(wù)器正(zhèng)被有(yǒu)效的(de)加速计算基礎設施所(suǒ)取(qǔ)代(dài)。NVIDIAA100GPU作(zuò)为端到(dào)端的(de)机器學(xué)習加速器,實(shí)現(xiàn)了(le)從數據(jù)分(fēn)析到(dào)訓练再到(dào)推理(lǐ)的(de)20倍AI性(xìng)能(néng)飛躍。到(dào)目前(qián)为止,这(zhè)是(shì)第(dì)一(yī)次(cì)在(zài)一(yī)个(gè)平台(tái)上(shàng)加速水平和(hé)垂直(zhí)擴展(zhǎn)的(de)負载(zài)。NVIDIAA100将降低(dī)數據(jù)中(zhōng)心的(de)成(chéng)本(běn),同(tóng)时(shí)增加吞吐量(liàng)。”
A100采用(yòng)的(de)新(xīn)型彈性(xìng)计算技術(shù)可(kě)以为每项工作(zuò)分(fēn)配适當的(de)计算能(néng)力。GPU技術(shù)可(kě)以把(bǎ)每一(yī)个(gè)A100GPU分(fēn)割成(chéng)七(qī)个(gè)單獨的(de)案(àn)例来(lái)執行推理(lǐ)任務(wù),而(ér)第(dì)三(sān)代(dài)則分(fēn)为七(qī)个(gè)單獨的(de)案(àn)例NVIDIANVLink®互聯技術(shù)可(kě)以将多(duō)个(gè)A100GPU合並(bìng)成(chéng)一(yī)个(gè)巨大(dà)的(de)GPU開(kāi)展(zhǎn)更(gèng)大(dà)規模的(de)培訓任務(wù)。
许多(duō)世界領先(xiān)的(de)雲(yún)服(fú)務(wù)提(tí)供商和(hé)系(xì)統構建商将计劃(huà)A100GPU集成(chéng)到(dào)其(qí)産品中(zhōng),包(bāo)括:阿里(lǐ)雲(yún),AWS,Atos,百(bǎi)度(dù)智能(néng)雲(yún),思(sī)科,DellTechnologies,富士通(tòng),技嘉科技,GoogleCloud,新(xīn)華三(sān),HPE,浪潮(cháo),聯想(xiǎng),MicrosoftAzure,甲骨(gǔ)文(wén),Quanta/QCT,Supermicro和(hé)騰訊雲(yún)。
在(zài)全(quán)球範围內(nèi)迅速采用(yòng)
Microsoft是(shì)首批采用(yòng)NVIDIAA100GPU计劃(huà)充分(fēn)利用(yòng)其(qí)性(xìng)能(néng)和(hé)可(kě)擴展(zhǎn)性(xìng)的(de)用(yòng)戶之(zhī)一(yī)。
Microsoft公(gōng)司副總(zǒng)裁MikhailParakhin表(biǎo)示:“Microsoft上(shàng)一(yī)代(dài)大(dà)規模應(yìng)用(yòng)NVIDIAGPU訓练了(le)世界上(shàng)最(zuì)大(dà)的(de)語(yǔ)言模型——TuringNaturalLanguageGeneration。Azure将使用(yòng)NVIDIA新(xīn)一(yī)代(dài)A100GPU訓练規模較大(dà)AI促進(jìn)語(yǔ)言、語(yǔ)音(yīn)、视覺和(hé)多(duō)模态技術(shù)領域的(de)最(zuì)新(xīn)發(fà)展(zhǎn)。”
DoorDash作(zuò)为餐廳在(zài)大(dà)流行期間(jiān)的(de)生(shēng)命線(xiàn),它(tā)指出(chū)了(le)拥有(yǒu)靈活的(de)人(rén)工智能(néng)基礎設施的(de)重(zhòng)要(yào)性(xìng)。
DoorDash机器學(xué)習工程师(shī)GaryRen表(biǎo)示:“現(xiàn)代(dài)繁雜AI培訓和(hé)推理(lǐ)工作(zuò)負荷需要(yào)處(chù)理(lǐ)大(dà)量(liàng)的(de)數據(jù),比如(rú)NVIDIAA100GPU这(zhè)種(zhǒng)最(zuì)先(xiān)進(jìn)的(de)技術(shù)有(yǒu)助于(yú)縮短(duǎn)模型訓练时(shí)間(jiān),加速机器學(xué)習的(de)發(fà)展(zhǎn)过(guò)程。此(cǐ)外(wài),基于(yú)雲(yún)的(de)使用(yòng)GPU集群(qún)還(huán)可(kě)以为我(wǒ)们(men)提(tí)供更(gèng)高(gāo)的(de)靈活性(xìng),可(kě)以根(gēn)據(jù)需要(yào)進(jìn)行擴容或(huò)縮容,将有(yǒu)助于(yú)提(tí)高(gāo)效率,簡化(huà)操作(zuò),节(jié)约成(chéng)本(běn)。”
其(qí)他(tā)最(zuì)初的(de)用(yòng)戶還(huán)包(bāo)括许多(duō)國(guó)家(jiā)實(shí)验(yàn)室(shì)和(hé)一(yī)些(xiē)世界頂級的(de)高(gāo)等教育和(hé)研究机構,他(tā)们(men)正(zhèng)在(zài)使用(yòng)它(tā)们(men)A100支持(chí)其(qí)新(xīn)一(yī)代(dài)超級计算机。以下(xià)是(shì)一(yī)些(xiē)初始(shǐ)用(yòng)戶:
印(yìn)第(dì)安(ān)納大(dà)學(xué)(IndianaUniversity),在(zài)國(guó)外(wài),其(qí)BigRed基于(yú)200超級计算机的(de)超級计算机HPE的(de)CrayShasta系(xì)統。超級计算机将支持(chí)科學(xué)和(hé)醫學(xué)研究以及(jí)AI,前(qián)沿研究机器學(xué)習和(hé)數據(jù)分(fēn)析領域。
利希超算中(zhōng)心(JülichSupercomputingCentre),在(zài)德國(guó),其(qí)JUWELS增速系(xì)統由(yóu)Atos專为极端计算能(néng)力和(hé)极端计算能(néng)力而(ér)設计AI設计任務(wù)。
卡尔斯魯厄理(lǐ)工大(dà)學(xué)(KarlsruheInstituteofTechnology),在(zài)德國(guó),它(tā)正(zhèng)在(zài)與(yǔ)聯想(xiǎng)一(yī)起(qǐ)建造它(tā)HoreKa超級计算机。超級计算机将能(néng)夠在(zài)材料科學(xué)、地(dì)球系(xì)統科學(xué)、能(néng)源和(hé)动力工程研究以及(jí)粒(lì)子和(hé)天(tiān)體(tǐ)物(wù)理(lǐ)學(xué)領域進(jìn)行更(gèng)大(dà)規模的(de)多(duō)規模模拟。
馬克(kè)斯普朗克(kè)计算和(hé)數據(jù)中(zhōng)心(MaxPlanckComputingandDataFacility),在(zài)德國(guó),新(xīn)一(yī)代(dài)超級计算机由(yóu)聯想(xiǎng)建造Raven,馬克(kè)斯普朗克(kè)研究所(suǒ)(MaxPlanckInstitutes)開(kāi)發(fà)、改進(jìn)、分(fēn)析和(hé)可(kě)视化(huà)的(de)高(gāo)性(xìng)能(néng)计算應(yìng)用(yòng)提(tí)供了(le)先(xiān)進(jìn)的(de)支持(chí)。
美(měi)國(guó)能(néng)源部(bù)國(guó)家(jiā)能(néng)源研究科學(xué)计算中(zhōng)心(U.S.DepartmentofEnergy’sNationalEnergyResearchScientificComputingCenter),位(wèi)于(yú)美(měi)國(guó)勞倫斯伯克(kè)利國(guó)家(jiā)實(shí)验(yàn)室(shì)(LawrenceBerkeleyNationalLaboratory),其(qí)正(zhèng)在(zài)基于(yú)HPE的(de)CrayShasta新(xīn)一(yī)代(dài)超級计算机系(xì)統建設Perlmutter。超級计算机将用(yòng)于(yú)支持(chí)大(dà)規模的(de)科學(xué)研究,開(kāi)發(fà)新(xīn)能(néng)源,提(tí)高(gāo)能(néng)源效率,探索新(xīn)材料。
A100的(de)五(wǔ)大(dà)突破
NVIDIAA100GPU突破性(xìng)技術(shù)設计来(lái)自(zì)五(wǔ)大(dà)關(guān)鍵創新(xīn):
NVIDIAAmpere架構–A100的(de)核心是(shì)NVIDIAAmpereGPU这(zhè)種(zhǒng)體(tǐ)系(xì)結構包(bāo)括一(yī)个(gè)超过(guò)540亿(yì)的(de)晶體(tǐ)管(guǎn),它(tā)成(chéng)为世界上(shàng)最(zuì)大(dà)的(de)7納米(mǐ)Cpu。
具有(yǒu)TF32的(de)第(dì)三(sān)代(dài)TensorCore核心–NVIDIA普遍(biàn)采用(yòng)的(de)TensorCore核心現(xiàn)在(zài)變(biàn)得更(gèng)加靈活、快(kuài)速和(hé)易于(yú)使用(yòng)。擴展(zhǎn)後(hòu),增加了(le)其(qí)功能(néng)AI開(kāi)發(fà)的(de)全(quán)新(xīn)TF32,它(tā)可(kě)以使其(qí)無需更(gèng)改任何代(dài)碼FP32精度(dù)下(xià)的(de)AI性(xìng)能(néng)提(tí)升(shēng)多(duō)达(dá)20倍。TensorCore現(xiàn)在(zài)核心支持(chí)FP與(yǔ)上(shàng)一(yī)代(dài)相比,64精度(dù)HPC應(yìng)用(yòng)程序提(tí)供的(de)计算能(néng)力比以前(qián)提(tí)高(gāo)了(le)多(duō)达(dá)2倍.5倍。
多(duō)實(shí)例GPU–MIG,一(yī)種(zhǒng)全(quán)新(xīn)的(de)技術(shù)功能(néng),可(kě)以單獨使用(yòng)A100GPU多(duō)达(dá)七(qī)个(gè)獨立GPU,为不(bù)同(tóng)規模的(de)工作(zuò)提(tí)供不(bù)同(tóng)的(de)计算能(néng)力,從而(ér)最(zuì)大(dà)化(huà)最(zuì)佳利用(yòng)率和(hé)投資回(huí)報率。
第(dì)三(sān)代(dài)NVIDIANVLink–使GPU两(liǎng)者(zhě)之(zhī)間(jiān)的(de)高(gāo)速連(lián)接增加到(dào)原来(lái)的(de)两(liǎng)倍,從而(ér)實(shí)現(xiàn)服(fú)務(wù)器的(de)高(gāo)效性(xìng)能(néng)擴展(zhǎn)。
結構化(huà)稀疏–这(zhè)種(zhǒng)新(xīn)種(zhǒng)新(xīn)的(de)效率技術(shù)AI數學(xué)固有(yǒu)的(de)稀疏性(xìng),使性(xìng)能(néng)翻倍。
有(yǒu)了(le)这(zhè)些(xiē)新(xīn)功能(néng),NVIDIAA100變(biàn)成(chéng)了(le)AI訓练與(yǔ)推理(lǐ),科學(xué)模拟,对话AI,各(gè)種(zhǒng)高(gāo)要(yào)求工作(zuò)負荷的(de)理(lǐ)想(xiǎng)選擇,如(rú)推薦系(xì)統、基因组學(xué)、高(gāo)性(xìng)能(néng)數據(jù)分(fēn)析、地(dì)震建模、财務(wù)預測等。
新(xīn)系(xì)統已經(jīng)搭载(zài)NVIDIAA100,即将登陆雲(yún)端
今天(tiān)同(tóng)时(shí)發(fà)布(bù)NVIDIADGX™A100系(xì)統,其(qí)內(nèi)置8个(gè)NVIDIANVLink互聯的(de)NVIDIAA100GPU。NVIDIA與(yǔ)官方(fāng)合作(zuò)夥伴現(xiàn)在(zài)已經(jīng)開(kāi)始(shǐ)供應(yìng)系(xì)統。
阿里(lǐ)雲(yún),AWS,百(bǎi)度(dù)智能(néng)雲(yún),GoogleCloud,MicrosoftAzure,甲骨(gǔ)文(wén)和(hé)騰訊雲(yún)计劃(huà)提(tí)供基于(yú)A100的(de)服(fú)務(wù)。
此(cǐ)外(wài),许多(duō)世界領先(xiān)的(de)系(xì)統制造商還(huán)将提(tí)供各(gè)種(zhǒng)基于(yú)A100服(fú)務(wù)器,包(bāo)括Atos,思(sī)科,DellTechnologies,富士通(tòng),技嘉科技,新(xīn)華三(sān),HPE,浪潮(cháo),聯想(xiǎng),Quanta/QCT和(hé)Supermicro。
为了(le)幫助合作(zuò)夥伴加速服(fú)務(wù)器的(de)開(kāi)發(fà),NVIDIA開(kāi)發(fà)了(le)HGXA100服(fú)務(wù)器構建模块(kuài),采用(yòng)多(duō)个(gè)模块(kuài)GPU集成(chéng)基板配置。
HGXA1004-GPU通(tòng)过(guò)NVLink實(shí)現(xiàn)GPU完整的(de)互連(lián),8-GPU配置的(de)HGX
