欧洲午夜精品久久久久久,欧美freesex黑人又粗又大

NPU芯片有什么用，算力是怎么評估的？

2023-03-08 2744次

NPU芯片有什么用，算力是怎么評估的?

算力簡單說就是計算能力，按《中國算力發(fā)展指數白皮書》中的定義算力是設備通過處理數據，實現特定結果輸出的計算能力。2018年諾貝爾經濟學獎獲得者William D. Nordhau濾《計算過程》一文中提出：“算力是設備根據內部每秒可處理的信息數據量"。算力實現的核心是CPU、GPU等各類計算芯片，并由計算機、服務器、高性能計多集群和各類智能終端等承載，海量數據處理和各種數字化應用都離不開算力的加工和計算。

以AI為例，CPU、GPU、DSP等都可以運行，但是還是有專用的AI芯片，為什么呢?也跟算力有關。

CPU(central processing unit)是通用處理器，可以處理一切事物，就像一把瑞士軍刀，哪方面都能做但都不是專業(yè)高效的。

GPU(Graphics Processing Unit)是專門用來處理圖形圖像相關的處理器，與CPU相比GPU處理的數據類型單一，因為運算與AI相似以及容易組成大的集群，所以進行AI運算時在性能、功耗等很多方面遠遠優(yōu)于CPU，經常被拿來處理AI運算。

DSP(digital signal processor)，是專門用來處理數字信號的，DSP與GPU情況相似，也會被拿來做AI運算，比如高通的手機SoC。

AI芯片是專門用來處理AI相關運算的芯片，這與CPU、GPU、DSP的“兼職”做AI運算不同，即便是最高效的GPU與AI芯片相比也是有差距的，AI芯片在時延、性能、功耗、能效比等方面全面的超過上面提到的各種處理器。以知名的谷歌的TPU為例，如下圖所示，TPU的主要計算資源為：

Matrix Multiply Unit：矩陣乘單元

Accumulators：存儲矩陣乘加輸出的中間結果

Activation：激活單元

Unified Buffer：統(tǒng)一緩存

當時谷歌資深硬件工程師Norman Jouppi表示，谷歌的專用機器學習芯片TPU處理速度要比GPU和CPU快15-30倍(和TPU對比的是英特爾Haswell CPU以及Nvidia Tesla K80 GPU)，而在能效上，TPU更是提升了30到80倍，這并不意外，因為TPU運行的CNN運算主要就是矩陣乘，專用芯片好處就是這樣。其實對于對于AI來說，又分為訓練和推理，訓練就像AlphaGo一樣需要學很多的棋譜(數據)，通常采用數據精度為FP32。

FP32(Full Precise Float 32，單精度)占用4個字節(jié)，共32bit，

FP16(float，半精度)占用2個字節(jié)，共16bit，

INT8，占用1個字節(jié)，也就是8bit，精度更低，因此數據量小、能耗低，計算速度相對更快，更符合端側運算的特點。

不同精度計算消耗的Bill Dally 在ACMMM 2017 上的《Efficient Methods and Hardware for Deep Learning》演講中曾經列過一個不同精度計算的消耗能量和硅片面積對比，可以看出一個FP32精度的乘法運算消耗是INT8精度的18.5倍。因此同樣一塊芯片運算INT8的數據與運算FP32的數據在同一時間內運算次數相差很多，也就是說不同精度OPS不同，算力不同。

這樣的精度如果運行在手機等終端上是不行的，所以在在手機、汽車、安防等終端領域，都是執(zhí)行模型的推理，現有的推理芯片有很多，比如特斯拉FSD、寒武紀NPU、地平線BPU、OPPO的馬里亞納、榮耀使用的AI-ISP等。與訓練階段不同，在推理的時候，精度要求并不高，以知名的對象監(jiān)測算法YOLO(You Only Look Once)為例，FP32的精度與INT8的精度相差甚小，但是因為模型更小，神經網絡模型的推理速度卻大幅加快。這在終端上很重要，比如在汽車的自動駕駛上，如果推理計算的數據慢了會造成巨大的影響。

當然在安防等對精度要求更低的地方，還有很多采用的是INT4精度的，比如愛芯科技的AX630A在INT4精度下的算力達到了28.8TOPS，可應用于智能盒子，運動相機，智能加速卡，工業(yè)攝像頭等領域，如果是INT8精度就是7.2TOPS(這里要注意的是并不是所有的AI芯片支持不同精度下的算力轉換，這需要硬件實現上的支持)

在終端芯片上，廠商宣稱的算力有時候甚至不是AI芯片的算力，因為CPU、GPU、DSP都可以進行AI的運算，所以在宣傳算力的時候采用的是CPU算力 + GPU算力 + DSP算力的算法，雖然這些處理單元都在一顆芯片上但是在實際使用上不可能同時進行AI運算。

因為一些手機芯片的AI處理能力不足，以及處理流程在YUV域較為靠后，所以像OPPO等廠商開始推出馬里亞納這樣的AI芯片，18TOPS并前置在手機SOC之前在RAW域進行 AI降噪的處理，可以大幅的提升夜景拍攝能力，保留更多細節(jié)。

榮耀采用的AI-ISP也是一樣的道理，其實這類芯片本質上是一個處理AI運算的NPU，從業(yè)務上來說更好的叫法是Pre-ISP，并不是真正的ISP芯片。

RS-485 CAN總線芯片選型和應用上一篇下一篇 LM358雙路運放電路

最新文章

一文讀懂DRAM（動態(tài)隨機存取存儲器）工作原理、分類、主要廠商

DRAM是一種易失性半導體存儲器，用于計算機和其他數字設備作為主內存。它的名字“動態(tài)”源于需要周期性刷新存儲的數據。

2025-06-19 364次

一文讀懂FPGA的工作原理、關鍵參數、品牌、運用

FPGA代表Field-Programmable Gate Array，中文譯為現場可編程門陣列。它是一種非常特殊的半導體集成電路芯片。與 CPU、GPU 或專用集成電路芯片在出廠時功能就固定不同，FPGA的硬件邏輯功能在制造完成后，可以由用戶在現場（Field）根據需要進行編程（Programmable）來定義。它本質上是由大量可配置邏輯塊、可編程互連資源和豐富的輸入/輸出單元組成的陣列（Array）。

2025-06-05 231次

一文讀懂ADC（模數轉換器）與DAC（數模轉換器）類型、應用

ADC（模數轉換器）與DAC（數模轉換器）芯片是連接模擬世界與數字系統(tǒng)的核心元器件，廣泛應用于通信、工業(yè)控制、醫(yī)療設備、消費電子等領域。以下是它們的核心技術原理、類型及市場應用解析：

2025-05-21 178次

一文讀懂GNSS模組產品分類、品牌、運用

全球導航衛(wèi)星系統(tǒng)（GNSS，Global Navigation Satellite System）是一種通過衛(wèi)星信號提供地理定位、導航和時間同步服務的技術。常見的GNSS包括美國的GPS、俄羅斯的GLONASS、歐盟的伽利略（Galileo）和中國的北斗（BDS）。以下從產品、品牌和應用領域三個方面進行介紹：

2025-04-28 380次

一文讀懂什么是MEMS壓力傳感器？

MEMS壓力傳感器是一種基于微機電系統(tǒng)（Micro-Electro-Mechanical Systems, MEMS）技術制造的微型傳感器，主要用于測量氣體或液體的壓力。憑借其小型化、高靈敏度和低成本等優(yōu)勢，MEMS壓力傳感器被廣泛應用于汽車、醫(yī)療、工業(yè)、消費電子和航空航天等領域。

2025-04-17 302次

更多資訊

熱門資訊

萬聯芯微信公眾號

元器件現貨+BOM配單+PCBA制造平臺

關注公眾號，優(yōu)惠活動早知道！

* 我的問題/建議：
* 聯系電話：
上傳圖片（選填）：	請您提交2M以內的jpg,gif,png格式文件
投訴訂單號（選填）：

h1_key

萬聯芯微信公眾號

4000-306-326