ARM 处理器 MIPS/DMIPS/MFLOPS

本文介绍了衡量CPU性能的三个关键指标:MIPS(百万指令/秒)、DMIPS(Dhrystone百万指令/秒)和FLOPS(浮点运算次数/秒)。MIPS和DMIPS关注整数运算性能,而FLOPS侧重于浮点运算能力。通过实例展示了不同处理器如ARM Cortex-A系列和GPU如NVIDIA T4的性能数据,揭示了现代处理器在不同类型计算任务中的差异和优势。
摘要由CSDN通过智能技术生成

转自:ARM 处理器 MIPS/DMIPS/MFLOPS 理解 - 走看看

现在随着计算机使用了多级流水线结构,取指、译码、执行等并行方式,单纯使用频率确定性能不太合理,所以采用计算性能来测定cpu性能比较合理,主要有MIPS,DMIPS和FLOPS三个主要概念,

MIPS(Million Instructions Per Second):字面理解为百万条指令/秒,即每秒执行百万级指令数。这是衡量CPU速度的一个指标。像是一个Intel 80386 电脑可以每秒处理3百万到5百万机器语言指令,既我们可以说80386是3到5MIPS的CPU。MIPS只是衡量CPU性能的指标。

DMIPS(Dhrystone Million Instructions executed Per Second):Dhrystone是测量处理器运算能力的最常见基准程序之一,常用于处理器的整型运算性能的测量。Dhrystone是一种整数运算测试程序。

FLOPS:Floating-point Operations Per Second, 表示CPU的每秒执行的浮点运算次数,主要用于衡量计算机的浮点运算能力。

  • 1 MFLOPS = 10^6 FLOPS
  • 1 GFLOPS = 10^9 FLOPS
  • 1 TFLOPS = 10^12 FLOPS
  • 1 PFLOPS = 10^15 FLOPS

TOPS: Tera Operations Per Second, 处理器每秒钟可进行10^12操作,包括整数的运算和浮点数运算,和FLOPS有一定差别。
例如 NVIDIA T4显卡性能 :NVIDIA T4 Tensor Core GPU for AI Inference | NVIDIA Data Center
说明了FP32的浮点运算为 8.1TFLOPS,但是用INT4的整数运算时,可达到 260 TOPS

参数数值
TURING TENSOR CORES320
NVIDIA CUDA® CORES2,560
SINGLE PRECISION PERFORMANCE8.1 FP32 TFLOPS
MIXED PRECISION (FP16/FP32)65 FP16 TFLOPS
INT8 PRECISION130 INT8 TOPS
INT4 PRECISION260 INT4 TOPS

例如 TFLOPS比较

产品性能
谷歌 Cloud TPU v3420 TFLOPS
华为昇腾910256 TFLOPS
Groq TSP250 TFLOPS
NVIDIA Tesla V100 GPU125 TFLOPS
Intel Movidius100 GFLOPS
Intel 10代酷睿1.12 (FP32)TFLOPS
2.25(FP16)TFLOPS
地平线 Sunrise4 TOPS
高通骁龙86515 TOPS
高通骁龙8557 TOPS

ARM处理器比较

Cortex-A系列

CoreArchitecturebitsI-CacheD-CacheDMIPS/MHz
ARM11v7-A324-64K4-64K1.25
Cortex-A5ARMv7-A324-64K4-64K1.57
Cortex-A7ARMv7-A328-64K8-64K1.9
Cortex-A8ARMv7-A3216-32K16-32K2.0
Cortex-A9ARMv7-A3216-64K16-64K2.5
Cortex-A12ARMv7-A32--3.5
Cortex-A15ARMv7-A3232K32K3.4
Cortex-A17ARMv7-A3232-64K32K3.2
Cortex-A32ARMv8-A328-64K8-64K2.3
Cortex-A35ARMv8-A32/648-64K8-64K2.5
Cortex-A53ARMv8-A32/648-64K8-64K2.3
Cortex-A55ARMv8.2-A32/6464K64K2.7
Cortex-A57ARMv8-A32/6448K32K4.1
Cortex-A72ARMv8-A32/6448K32K4.7
Cortex-A73ARMv8-A32/6464K32-64k4.8
Cortex-A75ARMv8.2-A32/6464K64k5.2
Cortex-A76ARMv8.2-A32/6464K64k-

Cortex-M系列

CoreArchitecturebitsDMIPS/MHzDSP
Cortex-M0ARMv6M320.9~0.99
Cortex-M3ARMv6M321.25~1.5
Cortex-M4ARMv6M321.25~1.528/16 SMID 单精度FPU
Cortex-M7ARMv7-M322.14/2.55/3.238/16 SMID 双精度FPU

参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值