一(yī)篇(piān)文(wén)章为您解(jiě)答(dá)關(guān)于(yú)NVIDIADLA的(de)基本(běn)問(wèn)题
NVIDIA的(de)DLA硬(yìng)件(jiàn)是(shì)專为深度(dù)學(xué)習操作(zuò)而(ér)設计的(de)固定(dìng)功能(néng)加速引擎。它(tā)旨在(zài)对卷(juǎn)積神經(jīng)网(wǎng)络進(jìn)行全(quán)硬(yìng)件(jiàn)加速,支持(chí)各(gè)種(zhǒng)层(céng),如(rú)卷(juǎn)積、反卷(juǎn)積、全(quán)連(lián)接、激活、池化(huà)、批量(liàng)歸一(yī)化(huà)等。NVIDIA的(de)JetsonOrinSoC最(zuì)多(duō)支持(chí)2个(gè)第(dì)二(èr)代(dài)DLA(第(dì)二(èr)代(dài)DLA在(zài)功耗效率方(fāng)面(miàn)表(biǎo)現(xiàn)最(zuì)佳),而(ér)XavierSoC最(zuì)多(duō)支持(chí)2个(gè)第(dì)一(yī)代(dài)DLA。
DLA软(ruǎn)件(jiàn)包(bāo)括DLA編譯器和(hé)DLA運行时(shí)堆(duī)栈。離線(xiàn)編譯器能(néng)夠将神經(jīng)网(wǎng)络图(tú)轉(zhuǎn)換成(chéng)DLA可(kě)加载(zài)的(de)二(èr)進(jìn)制文(wén)件(jiàn),用(yòng)戶可(kě)以通(tòng)过(guò)NVIDIATensorRT™、NvMedia-DLA或(huò)cuDLA進(jìn)行調用(yòng)。運行时(shí)堆(duī)栈由(yóu)DLA固件(jiàn)、內(nèi)核模式驅动程序和(hé)用(yòng)戶模式驅动程序组成(chéng)。
更(gèng)多(duō)詳细(xì)信(xìn)息,请參考DLA産品页(yè)面(miàn)(https://developer.nvidia.com/deep-learning-accelerator)。
为什(shén)麼(me)在(zài)Orin上(shàng)使用(yòng)DLA是(shì)必要(yào)的(de)?
根(gēn)據(jù)下(xià)表(biǎo)中(zhōng)的(de)電(diàn)源模式,DLA的(de)峰(fēng)值性(xìng)能(néng)对Orin的(de)總(zǒng)深度(dù)學(xué)習(DL)性(xìng)能(néng)貢獻在(zài)38%至(zhì)74%之(zhī)間(jiān)。
在(zài)JetPack5.1.1下(xià),根(gēn)據(jù)不(bù)同(tóng)電(diàn)源模式和(hé)工作(zuò)負载(zài)的(de)情(qíng)況,DLA相对于(yú)GPU的(de)功耗效率平均高(gāo)出(chū)3倍至(zhì)5倍。下(xià)表(biǎo)展(zhǎn)示了(le)基于(yú)JetsonAGXOrin64GB的(de)DLA與(yǔ)GPU在(zài)加速器功耗以及(jí)每秒(miǎo)處(chù)理(lǐ)的(de)图(tú)像數方(fāng)面(miàn)的(de)性(xìng)能(néng)與(yǔ)功耗比率。
注意(yì):
JetsonAGXOrin64GB在(zài)30W和(hé)50W功率模式下(xià)的(de)DLATOPs與(yǔ)DRIVEOrin平台(tái)用(yòng)于(yú)汽车領域的(de)最(zuì)大(dà)时(shí)钟頻率相當。
JetsonOrinNX16GB的(de)最(zuì)大(dà)DLATOPs與(yǔ)JetsonAGXOrin64GB在(zài)15W功率模式下(xià)具有(yǒu)相同(tóng)的(de)性(xìng)能(néng)。
