夜夜撸,91麻豆精品国产91久久久熟女,天天摸天天干,亚洲久久电影,久久久久久久久久久国产,国产怡红院,91免费在线视频,欧美激情亚洲,五月天婷婷基地,嫩BBB槡BBBB搡BBBB视频,怡红院播放器,日本级婬乱片A片AAA毛片动漫,欧美日韩国产中文字幕,国产午夜成人,亚洲AV无码成人精品区,亚洲精品97久久中文字,中国毛片网站,天天影视天天干,久婷婷,九九亚洲精品

NVIDIA 在(zài) MLPerf 測試中(zhōng)将推理(lǐ)带(dài)到(dào)新(xīn)高(gāo)度(dù)

行業动态 | 2023-06-02 11:05:14 | 瀝拓

　　NVIDIAH100和(hé)L4GPU在(zài)最(zuì)新(xīn)的(de)MLPerf基準測試中(zhōng)将生(shēng)成(chéng)式AI和(hé)其(qí)它(tā)所(suǒ)有(yǒu)工作(zuò)負荷带(dài)到(dào)了(le)一(yī)个(gè)新(xīn)的(de)水平，JetsonAGXOrin在(zài)性(xìng)能(néng)和(hé)效率方(fāng)面(miàn)都有(yǒu)所(suǒ)提(tí)高(gāo)。

　　MLPerf作(zuò)为一(yī)个(gè)獨立的(de)第(dì)三(sān)方(fāng)基準測試，仍然是(shì)衡量(liàng)AI特(tè)性(xìng)的(de)權威标(biāo)準。自(zì)MLPerf誕生(shēng)以来(lái)，NVIDIAAI平台(tái)在(zài)訓练和(hé)推理(lǐ)方(fāng)面(miàn)一(yī)直(zhí)處(chù)于(yú)領先(xiān)地(dì)位(wèi)，包(bāo)括最(zuì)新(xīn)發(fà)布(bù)的(de)MLPerfInference3.0基準測試。

　　NVIDIA創始(shǐ)人(rén)兼首席(xí)執行官黃仁勳说(shuō)：“三(sān)年(nián)前(qián)我(wǒ)们(men)推出(chū)A100的(de)时(shí)候，AI世界是(shì)由(yóu)计算机视覺主(zhǔ)導的(de)。現(xiàn)在(zài)，生(shēng)成(chéng)AI已經(jīng)到(dào)来(lái)。

　　通(tòng)过(guò)Transformer引擎对GPT進(jìn)行了(le)優化(huà)，这(zhè)就(jiù)是(shì)我(wǒ)们(men)創建Hopper的(de)原因。最(zuì)新(xīn)的(de)MLPerf3.0凸显了(le)Hopper的(de)性(xìng)能(néng)是(shì)A100的(de)4倍。

　　“下(xià)一(yī)階(jiē)段(duàn)的(de)生(shēng)成(chéng)式AI需要(yào)一(yī)个(gè)高(gāo)能(néng)效的(de)新(xīn)型AI基礎設施来(lái)訓练大(dà)型語(yǔ)言模型。为了(le)構建由(yóu)數万(wàn)个(gè)通(tòng)过(guò)NVIDIANVLink和(hé)InfiniBand連(lián)接的(de)HopperGPU组成(chéng)的(de)AI基礎設施，客戶正(zhèng)大(dà)規模選擇Hopper。”

　　行業正(zhèng)在(zài)努力推动安(ān)全(quán)可(kě)靠的(de)生(shēng)成(chéng)式AI取(qǔ)得新(xīn)的(de)進(jìn)展(zhǎn)。而(ér)且(qiě)Hopper正(zhèng)在(zài)推动这(zhè)项重(zhòng)要(yào)工作(zuò)。

　　根(gēn)據(jù)最(zuì)新(xīn)的(de)MLPerf數據(jù)，NVIDIA将AI推理(lǐ)性(xìng)能(néng)和(hé)效率從雲(yún)向(xiàng)邊(biān)緣提(tí)升(shēng)到(dào)了(le)一(yī)个(gè)新(xīn)的(de)水平。

　　具體(tǐ)而(ér)言，NVIDIAH100TensorCoreGPU在(zài)DGXH100系(xì)統中(zhōng)運行，在(zài)每个(gè)AI推理(lǐ)測試(即在(zài)生(shēng)産中(zhōng)運行神經(jīng)网(wǎng)络)中(zhōng)都表(biǎo)現(xiàn)出(chū)最(zuì)高(gāo)的(de)性(xìng)能(néng)。得益于(yú)软(ruǎn)件(jiàn)優化(huà)，GPU在(zài)9月(yuè)份首次(cì)亮(liàng)相时(shí)實(shí)現(xiàn)了(le)54%的(de)性(xìng)能(néng)提(tí)升(shēng)。

　　对于(yú)醫疗領域，H100GPU在(zài)3D-UNet與(yǔ)9月(yuè)份相比，MLPerf醫學(xué)影像基準測試的(de)性(xìng)能(néng)提(tí)高(gāo)了(le)31%。

　　在(zài)Transformer引擎的(de)加持(chí)下(xià)，基于(yú)Hopper結構的(de)H100GPU在(zài)BERT方(fāng)面(miàn)的(de)表(biǎo)現(xiàn)非(fēi)常出(chū)色(sè)。BERT是(shì)一(yī)種(zhǒng)基于(yú)transformer的(de)大(dà)型語(yǔ)言模型，它(tā)为生(shēng)成(chéng)式AI奠定(dìng)了(le)基礎，目前(qián)已經(jīng)得到(dào)了(le)廣泛的(de)應(yìng)用(yòng)。

　　生(shēng)成(chéng)AI允许用(yòng)戶快(kuài)速建立文(wén)本(běn)、图(tú)像和(hé)3D模型。從創業公(gōng)司到(dào)雲(yún)服(fú)務(wù)提(tí)供商，企業为了(le)實(shí)現(xiàn)新(xīn)的(de)業務(wù)模式，加快(kuài)當前(qián)業務(wù)，正(zhèng)在(zài)迅速選擇这(zhè)種(zhǒng)能(néng)力。

　　为了(le)獲得即时(shí)響應(yìng)，數亿(yì)人(rén)現(xiàn)在(zài)正(zhèng)在(zài)使用(yòng)ChatGPT(同(tóng)樣(yàng)是(shì)transformer模型)等生(shēng)成(chéng)式AI工具。

　　在(zài)这(zhè)个(gè)AIiPhone时(shí)刻(kè)，推理(lǐ)性(xìng)能(néng)尤为重(zhòng)要(yào)。深度(dù)學(xué)習的(de)部(bù)署(shǔ)幾(jǐ)乎無處(chù)不(bù)在(zài)，这(zhè)促進(jìn)了(le)对推理(lǐ)特(tè)性(xìng)的(de)無盡需求，從工廠(chǎng)车間(jiān)到(dào)在(zài)線(xiàn)推薦系(xì)統。

　　精彩的(de)L4GPU亮(liàng)相

　　在(zài)这(zhè)次(cì)MLPerf測試中(zhōng)，NVIDIAL4TensorCoreGPU首次(cì)亮(liàng)相，其(qí)速度(dù)是(shì)上(shàng)一(yī)代(dài)T4GPU的(de)3倍以上(shàng)。这(zhè)種(zhǒng)加速器具有(yǒu)扁平的(de)形狀，可(kě)以在(zài)大(dà)多(duō)數服(fú)務(wù)器中(zhōng)提(tí)供高(gāo)吞吐量(liàng)和(hé)低(dī)延遲。

　　所(suǒ)有(yǒu)MLPerf工作(zuò)負荷都由(yóu)L4GPU運行。在(zài)对關(guān)鍵FP8格式的(de)支持(chí)下(xià)，它(tā)在(zài)对性(xìng)能(néng)要(yào)求很高(gāo)的(de)BERT模型方(fāng)面(miàn)取(qǔ)得了(le)驚人(rén)的(de)效果(guǒ)。

　　L4GPU的(de)图(tú)像解(jiě)碼速度(dù)除了(le)出(chū)色(sè)的(de)AI性(xìng)能(néng)外(wài)，快(kuài)10倍，视頻響應(yìng)速度(dù)快(kuài)3.2倍，图(tú)形和(hé)實(shí)时(shí)渲染性(xìng)能(néng)提(tí)高(gāo)4倍以上(shàng)。

　　两(liǎng)周前(qián)，这(zhè)些(xiē)加速器在(zài)GTC上(shàng)發(fà)布(bù)，並(bìng)由(yóu)各(gè)大(dà)系(xì)統制造商和(hé)雲(yún)服(fú)務(wù)提(tí)供商提(tí)供。在(zài)GTC上(shàng)發(fà)布(bù)的(de)AI推理(lǐ)平台(tái)産品组合中(zhōng)，L4GPU是(shì)NVIDIA的(de)最(zuì)新(xīn)成(chéng)員。

　　在(zài)系(xì)統測試中(zhōng)，软(ruǎn)件(jiàn)和(hé)网(wǎng)络大(dà)放(fàng)异(yì)彩

　　在(zài)一(yī)个(gè)全(quán)新(xīn)的(de)MLPerf測試中(zhōng)，NVIDIA全(quán)栈AI平台(tái)显示出(chū)其(qí)領先(xiān)優勢。

　　Network-division被稱为Network-division的(de)基準測試，将數據(jù)傳輸到(dào)遠(yuǎn)程推理(lǐ)服(fú)務(wù)器。这(zhè)反映了(le)企業客戶将數據(jù)存儲在(zài)企業防火(huǒ)牆(qiáng)後(hòu)面(miàn)，並(bìng)在(zài)雲(yún)上(shàng)運行AI工作(zuò)的(de)热(rè)門(mén)场(chǎng)景。

　　遠(yuǎn)程NVIDIADGXA100系(xì)統在(zài)BERT檢測中(zhōng)提(tí)供了(le)高(gāo)达(dá)96%的(de)最(zuì)大(dà)本(běn)地(dì)性(xìng)能(néng)，其(qí)性(xìng)能(néng)下(xià)降的(de)一(yī)个(gè)原因是(shì)它(tā)们(men)需要(yào)等待CPU来(lái)完成(chéng)一(yī)些(xiē)任務(wù)。它(tā)们(men)在(zài)ResNet-50计算机视覺測試中(zhōng)达(dá)到(dào)了(le)100%的(de)性(xìng)能(néng)，僅僅依靠GPU来(lái)處(chù)理(lǐ)。

　　由(yóu)于(yú)NVIDIAQuantumInfiniband网(wǎng)络、NVIDIAConnectXSmartNIC、NVIDIAGPUDirect等软(ruǎn)件(jiàn)，这(zhè)两(liǎng)个(gè)結果(guǒ)在(zài)一(yī)定(dìng)程度(dù)上(shàng)是(shì)有(yǒu)益的(de)。

　　邊(biān)緣的(de)Orin性(xìng)能(néng)提(tí)高(gāo)3.2倍

　　另(lìng)外(wài)，與(yǔ)一(yī)年(nián)前(qián)的(de)結果(guǒ)相比，NVIDIAJetsonAGXOrin模块(kuài)化(huà)系(xì)統的(de)能(néng)效率提(tí)高(gāo)了(le)63%，性(xìng)能(néng)提(tí)高(gāo)了(le)81%。JetsonAGXOrin可(kě)以在(zài)需要(yào)AI的(de)狭小空(kōng)間(jiān)中(zhōng)進(jìn)行低(dī)功率推理(lǐ)，包(bāo)括在(zài)電(diàn)池供電(diàn)系(xì)統中(zhōng)。

　　JetsonOrinNX16G是(shì)專門(mén)为需要(yào)更(gèng)小模块(kuài)和(hé)更(gèng)低(dī)功耗的(de)應(yìng)用(yòng)而(ér)開(kāi)發(fà)的(de)，它(tā)在(zài)这(zhè)次(cì)基準測試中(zhōng)首次(cì)亮(liàng)相。它(tā)的(de)性(xìng)能(néng)是(shì)上(shàng)一(yī)代(dài)JetsonXavierNX處(chù)理(lǐ)器的(de)3.2倍。

　　NVIDIAAI生(shēng)态系(xì)統廣泛

　　根(gēn)據(jù)MLPerf數據(jù)，NVIDIAAI得到(dào)了(le)業界最(zuì)常見(jiàn)的(de)机器學(xué)習生(shēng)态系(xì)統的(de)支持(chí)。

　　本(běn)轮測試中(zhōng)，華碩、戴尔科技、技嘉、新(xīn)華三(sān)、聯想(xiǎng)、甯暢、超微、超聚變(biàn)等系(xì)統制造商和(hé)微软(ruǎn)Azure雲(yún)服(fú)務(wù)等10家(jiā)企業在(zài)NVIDIA平台(tái)上(shàng)提(tí)交了(le)結果(guǒ)。

　　根(gēn)據(jù)他(tā)们(men)提(tí)交的(de)結果(guǒ)，客戶可(kě)以通(tòng)过(guò)NVIDIAAI獲得優异(yì)的(de)性(xìng)能(néng)，無論是(shì)雲(yún)端還(huán)是(shì)自(zì)己的(de)數據(jù)中(zhōng)心運行服(fú)務(wù)器。

　　NVIDIA的(de)许多(duō)合作(zuò)夥伴也(yě)參與(yǔ)了(le)MLPerf，因为他(tā)们(men)知道这(zhè)是(shì)一(yī)个(gè)非(fēi)常有(yǒu)價值的(de)工具，可(kě)以幫助客戶評估AI平台(tái)和(hé)制造商。根(gēn)據(jù)最(zuì)新(xīn)一(yī)轮的(de)結果(guǒ)，随着NVIDIA平台(tái)的(de)發(fà)展(zhǎn)，他(tā)们(men)今天(tiān)提(tí)供的(de)性(xìng)能(néng)将会(huì)不(bù)斷提(tí)高(gāo)。

　　顧客需要(yào)的(de)是(shì)“多(duō)面(miàn)手(shǒu)”

　　NVIDIAAI是(shì)唯一(yī)一(yī)个(gè)能(néng)夠在(zài)數據(jù)中(zhōng)心和(hé)邊(biān)緣计算中(zhōng)運行所(suǒ)有(yǒu)MLPerf推理(lǐ)工作(zuò)負载(zài)和(hé)场(chǎng)景的(de)平台(tái)。其(qí)全(quán)面(miàn)的(de)性(xìng)能(néng)和(hé)效率使用(yòng)戶能(néng)夠成(chéng)为真(zhēn)正(zhèng)的(de)赢家(jiā)。

　　许多(duō)不(bù)同(tóng)类型的(de)神經(jīng)网(wǎng)络通(tòng)常用(yòng)于(yú)客戶的(de)實(shí)際應(yìng)用(yòng)，这(zhè)些(xiē)网(wǎng)络通(tòng)常需要(yào)立即提(tí)供答(dá)案(àn)。

　　例如(rú)，AI應(yìng)用(yòng)程序可(kě)能(néng)首先(xiān)需要(yào)了(le)解(jiě)客戶的(de)語(yǔ)音(yīn)要(yào)求，对图(tú)像進(jìn)行分(fēn)类，提(tí)出(chū)建议，並(bìng)以聲音(yīn)为語(yǔ)音(yīn)回(huí)答(dá)客戶。每一(yī)步都需要(yào)使用(yòng)不(bù)同(tóng)类型的(de)AI模型。

　　MLPerf基準測試包(bāo)括这(zhè)些(xiē)和(hé)其(qí)他(tā)流行的(de)AI工作(zuò)負荷，因此(cǐ)这(zhè)些(xiē)測試可(kě)以保證IT決策者(zhě)能(néng)夠獲得可(kě)靠且(qiě)靈活的(de)性(xìng)能(néng)。

　　用(yòng)戶可(kě)以根(gēn)據(jù)MLPerf的(de)結果(guǒ)做出(chū)明(míng)智的(de)購買(mǎi)決定(dìng)，因为这(zhè)些(xiē)測試是(shì)透明(míng)和(hé)客觀的(de)。这(zhè)个(gè)基準測試已經(jīng)獲得了(le)Arm。、百(bǎi)度(dù)、FacebookAI、廣泛支持(chí)谷(gǔ)歌(gē)、哈佛大(dà)學(xué)、英特(tè)尔大(dà)學(xué)、微软(ruǎn)大(dà)學(xué)、斯坦福大(dà)學(xué)和(hé)多(duō)倫多(duō)大(dà)學(xué)。

上(shàng)一(yī)篇(piān) : NVIDIAGraceHoper为加快(kuài)生(shēng)成(chéng)AI而(ér)設计的(de)非(fēi)常芯片全(quán)面(miàn)投産
下(xià)一(yī)篇(piān) : NVIDIAIsacNovaOrin開(kāi)啟了(le)自(zì)主(zhǔ)移动机器人(rén)創新(xīn)的(de)新(xīn)时(shí)代(dài)

NVIDIA 在(zài) MLPerf 測試中(zhōng)将推理(lǐ)带(dài)到(dào)新(xīn)高(gāo)度(dù)

在(zài)線(xiàn)咨詢