三张图均包括Control(控制单元)、ALU(运算单元)、Cache(高速缓冲存储器)
CPU(CentralProcessingUnit):中央处理器,大部分都是控制单元、少量的ALU进行运算,是一个串行结构,所以在进行计算密集型任务时效率不高,
GPU(Graphics Processing Unit):图形处理器 架构有一些小的control和cache单元用来存储数据和调度任务,但80%的ALU构成的,所以GPU的算力很强,并行运算
GPU拥有强大的并行计算能力,但功耗高,体积大,价格贵,无法用到一些小型移动设备上。因此才有了NPU——体积小、功耗低、计算效率高
NPU(NeuralNetwork Processing Unit):神经网络处理单元(AI处理器),由于深度学习计算的规则性,Npu使用解耦合的mem,ITCM和OTCM作为存储单元二是根据深度学习本身的特点,使NPU具有数据流的架构,各个计算单元PE间是有通信的,充分利用数据的复用性可以减少数据,在PE和I T C M这些存储单元之间的通信在减少功耗的同时,减少通信的实验
特点:计算和存储一体化
视频
视频
CPU | CentralProcessingUnit | 大量Control、少量ALU | 串行 |
---|---|---|---|
GPU | Graphics Processing Unit | 小的control和cache单元用来存储数据和调度任务,80%的ALU | 并行 |
NPU | NeuralNetwork Processing Unit | NPU | 并行 |