h1_key

當(dāng)前位置:首頁(yè) >新聞資訊 > 行業(yè)資訊>NPU芯片有什么用,算力是怎么評(píng)估的?
NPU芯片有什么用,算力是怎么評(píng)估的?
2023-03-08 2898次



NPU芯片有什么用,算力是怎么評(píng)估的?



  NPU芯片有什么用,算力是怎么評(píng)估的?

  算力簡(jiǎn)單說(shuō)就是計(jì)算能力,按《中國(guó)算力發(fā)展指數(shù)白皮書(shū)》中的定義算力是設(shè)備通過(guò)處理數(shù)據(jù),實(shí)現(xiàn)特定結(jié)果輸出的計(jì)算能力。2018年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者William D. Nordhau濾《計(jì)算過(guò)程》一文中提出:“算力是設(shè)備根據(jù)內(nèi)部每秒可處理的信息數(shù)據(jù)量"。算力實(shí)現(xiàn)的核心是CPU、GPU等各類(lèi)計(jì)算芯片,并由計(jì)算機(jī)、服務(wù)器、高性能計(jì)多集群和各類(lèi)智能終端等承載,海量數(shù)據(jù)處理和各種數(shù)字化應(yīng)用都離不開(kāi)算力的加工和計(jì)算。

  以AI為例,CPU、GPU、DSP等都可以運(yùn)行,但是還是有專(zhuān)用的AI芯片,為什么呢?也跟算力有關(guān)。

  CPU(central processing unit)是通用處理器,可以處理一切事物,就像一把瑞士軍刀,哪方面都能做但都不是專(zhuān)業(yè)高效的。

  GPU(Graphics Processing Unit)是專(zhuān)門(mén)用來(lái)處理圖形圖像相關(guān)的處理器,與CPU相比GPU處理的數(shù)據(jù)類(lèi)型單一,因?yàn)檫\(yùn)算與AI相似以及容易組成大的集群,所以進(jìn)行AI運(yùn)算時(shí)在性能、功耗等很多方面遠(yuǎn)遠(yuǎn)優(yōu)于CPU,經(jīng)常被拿來(lái)處理AI運(yùn)算。

  DSP(digital signal processor),是專(zhuān)門(mén)用來(lái)處理數(shù)字信號(hào)的,DSP與GPU情況相似,也會(huì)被拿來(lái)做AI運(yùn)算,比如高通的手機(jī)SoC。

  AI芯片是專(zhuān)門(mén)用來(lái)處理AI相關(guān)運(yùn)算的芯片,這與CPU、GPU、DSP的“兼職”做AI運(yùn)算不同,即便是最高效的GPU與AI芯片相比也是有差距的,AI芯片在時(shí)延、性能、功耗、能效比等方面全面的超過(guò)上面提到的各種處理器。以知名的谷歌的TPU為例,如下圖所示,TPU的主要計(jì)算資源為:

  Matrix Multiply Unit:矩陣乘單元

  Accumulators:存儲(chǔ)矩陣乘加輸出的中間結(jié)果

  Activation:激活單元

  Unified Buffer:統(tǒng)一緩存



NPU芯片有什么用,算力是怎么評(píng)估的?


  當(dāng)時(shí)谷歌資深硬件工程師Norman Jouppi表示,谷歌的專(zhuān)用機(jī)器學(xué)習(xí)芯片TPU處理速度要比GPU和CPU快15-30倍(和TPU對(duì)比的是英特爾Haswell CPU以及Nvidia Tesla K80 GPU),而在能效上,TPU更是提升了30到80倍,這并不意外,因?yàn)門(mén)PU運(yùn)行的CNN運(yùn)算主要就是矩陣乘,專(zhuān)用芯片好處就是這樣。其實(shí)對(duì)于對(duì)于AI來(lái)說(shuō),又分為訓(xùn)練和推理,訓(xùn)練就像AlphaGo一樣需要學(xué)很多的棋譜(數(shù)據(jù)),通常采用數(shù)據(jù)精度為FP32。

  FP32(Full Precise Float 32,單精度)占用4個(gè)字節(jié),共32bit,

  FP16(float,半精度)占用2個(gè)字節(jié),共16bit,

  INT8,占用1個(gè)字節(jié),也就是8bit,精度更低,因此數(shù)據(jù)量小、能耗低,計(jì)算速度相對(duì)更快,更符合端側(cè)運(yùn)算的特點(diǎn)。


NPU芯片有什么用,算力是怎么評(píng)估的?


  不同精度計(jì)算消耗的Bill Dally 在ACMMM 2017 上的《Efficient Methods and Hardware for Deep Learning》演講中曾經(jīng)列過(guò)一個(gè)不同精度計(jì)算的消耗能量和硅片面積對(duì)比,可以看出一個(gè)FP32精度的乘法運(yùn)算消耗是INT8精度的18.5倍。因此同樣一塊芯片運(yùn)算INT8的數(shù)據(jù)與運(yùn)算FP32的數(shù)據(jù)在同一時(shí)間內(nèi)運(yùn)算次數(shù)相差很多,也就是說(shuō)不同精度OPS不同,算力不同。


NPU芯片有什么用,算力是怎么評(píng)估的?


  這樣的精度如果運(yùn)行在手機(jī)等終端上是不行的,所以在在手機(jī)、汽車(chē)、安防等終端領(lǐng)域,都是執(zhí)行模型的推理,現(xiàn)有的推理芯片有很多,比如特斯拉FSD、寒武紀(jì)NPU、地平線BPU、OPPO的馬里亞納、榮耀使用的AI-ISP等。與訓(xùn)練階段不同,在推理的時(shí)候,精度要求并不高,以知名的對(duì)象監(jiān)測(cè)算法YOLO(You Only Look Once)為例,F(xiàn)P32的精度與INT8的精度相差甚小,但是因?yàn)槟P透?,神?jīng)網(wǎng)絡(luò)模型的推理速度卻大幅加快。這在終端上很重要,比如在汽車(chē)的自動(dòng)駕駛上,如果推理計(jì)算的數(shù)據(jù)慢了會(huì)造成巨大的影響。


NPU芯片有什么用,算力是怎么評(píng)估的?


  當(dāng)然在安防等對(duì)精度要求更低的地方,還有很多采用的是INT4精度的,比如愛(ài)芯科技的AX630A在INT4精度下的算力達(dá)到了28.8TOPS,可應(yīng)用于智能盒子,運(yùn)動(dòng)相機(jī),智能加速卡,工業(yè)攝像頭等領(lǐng)域,如果是INT8精度就是7.2TOPS(這里要注意的是并不是所有的AI芯片支持不同精度下的算力轉(zhuǎn)換,這需要硬件實(shí)現(xiàn)上的支持)


NPU芯片有什么用,算力是怎么評(píng)估的?


  在終端芯片上,廠商宣稱(chēng)的算力有時(shí)候甚至不是AI芯片的算力,因?yàn)镃PU、GPU、DSP都可以進(jìn)行AI的運(yùn)算,所以在宣傳算力的時(shí)候采用的是CPU算力 + GPU算力 + DSP算力的算法,雖然這些處理單元都在一顆芯片上但是在實(shí)際使用上不可能同時(shí)進(jìn)行AI運(yùn)算。


NPU芯片有什么用,算力是怎么評(píng)估的?


  因?yàn)橐恍┦謾C(jī)芯片的AI處理能力不足,以及處理流程在YUV域較為靠后,所以像OPPO等廠商開(kāi)始推出馬里亞納這樣的AI芯片,18TOPS并前置在手機(jī)SOC之前在RAW域進(jìn)行 AI降噪的處理,可以大幅的提升夜景拍攝能力,保留更多細(xì)節(jié)。



NPU芯片有什么用,算力是怎么評(píng)估的?


  榮耀采用的AI-ISP也是一樣的道理,其實(shí)這類(lèi)芯片本質(zhì)上是一個(gè)處理AI運(yùn)算的NPU,從業(yè)務(wù)上來(lái)說(shuō)更好的叫法是Pre-ISP,并不是真正的ISP芯片。

  • 一文讀懂什么是光模塊、內(nèi)部結(jié)構(gòu)、所用器件、用途?
  • 光模塊,全稱(chēng)光收發(fā)一體模塊,是光纖通信系統(tǒng)中的核心器件。它的作用簡(jiǎn)單來(lái)說(shuō)就是完成光電轉(zhuǎn)換。 在發(fā)送端:將設(shè)備(如交換機(jī)、路由器)產(chǎn)生的電信號(hào)轉(zhuǎn)換為光信號(hào),通過(guò)光纖傳輸出去。 在接收端:將光纖傳輸過(guò)來(lái)的光信號(hào)轉(zhuǎn)換為電信號(hào),提供給設(shè)備處理。
    2025-12-09 2354次
  • 一文讀懂衛(wèi)星通信器件種類(lèi)、功能、廠商、發(fā)展趨勢(shì)
  • 衛(wèi)星通信是一個(gè)復(fù)雜的系統(tǒng),它通過(guò)人造地球衛(wèi)星作為中繼站,來(lái)轉(zhuǎn)發(fā)無(wú)線電信號(hào),實(shí)現(xiàn)兩個(gè)或多個(gè)地球站之間的通信。這個(gè)系統(tǒng)可以大致分為三部分:空間段(衛(wèi)星本身)、地面段(用戶(hù)終端和信關(guān)站)和連接它們的無(wú)線電波。
    2025-10-10 1568次
  • 國(guó)產(chǎn)FPGA公司、核心產(chǎn)品、應(yīng)用介紹
  • 近年來(lái),國(guó)產(chǎn)FPGA發(fā)展迅速,在技術(shù)、生態(tài)和應(yīng)用方面都取得了長(zhǎng)足進(jìn)步,成為實(shí)現(xiàn)芯片國(guó)產(chǎn)替代的關(guān)鍵力量。以下是對(duì)主要國(guó)產(chǎn)FPGA公司的詳細(xì)介紹:
    2025-09-28 3386次
  • 一文讀懂?dāng)?shù)字隔離器芯片的原理、運(yùn)用、品牌、選型要點(diǎn)
  • 隔離器芯片的核心目的是在兩個(gè)電氣系統(tǒng)之間提供電氣隔離,同時(shí)允許數(shù)字信號(hào)或數(shù)據(jù)(有時(shí)甚至是電源)穿越這個(gè)隔離屏障。隔離意味著兩側(cè)電路沒(méi)有直接的電氣連接(沒(méi)有共用的地線或電源),從而防止危險(xiǎn)的電壓、電流浪涌、地線環(huán)路干擾或噪聲從一側(cè)傳遞到另一側(cè),保護(hù)人員和設(shè)備安全,并確保信號(hào)的完整性。
    2025-08-21 400次
  • 一文讀懂DRAM(動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器)工作原理、分類(lèi)、主要廠商
  • DRAM是一種易失性半導(dǎo)體存儲(chǔ)器,用于計(jì)算機(jī)和其他數(shù)字設(shè)備作為主內(nèi)存。它的名字“動(dòng)態(tài)”源于需要周期性刷新存儲(chǔ)的數(shù)據(jù)。
    2025-06-19 1527次

    萬(wàn)聯(lián)芯微信公眾號(hào)

    元器件現(xiàn)貨+BOM配單+PCBA制造平臺(tái)
    關(guān)注公眾號(hào),優(yōu)惠活動(dòng)早知道!
    10s
    溫馨提示:
    訂單商品問(wèn)題請(qǐng)移至我的售后服務(wù)提交售后申請(qǐng),其他需投訴問(wèn)題可移至我的投訴提交,我們將在第一時(shí)間給您答復(fù)
    返回頂部