CPU算力用DMIPS描述
DMIPS:Dhrystone Million Instructions executed Per Second,每秒执行百万条指令,用来计算同一秒内系统的处理能力,即每秒执行了多少百万条指令。
CPU的DMIPS算力计算公式为:内核的数量 * 主频 * DMIPS/MHz 。
例如,六核A55架构,主频为1.6GHz,性能为2.7DMIPS/MHz,算力DMIPS = 6 * 1660MHz * 2.7DMIPS/MHz = 31374 DMIPS.
GPU用TOPS和FLOPS描述
TOPS(Tera Operations Per Second的缩写),1TOPS代表处理器每秒钟可进行一万亿次(10^12)操作。
TOPS=MAC矩阵行 * MAC矩阵列 * 主频 * 2
特斯拉的FSD芯片,96x96 MAC,主频2GHz
TOPS = 96 * 96 * 2000000000 * 2 = 36.864 TOPS
FLOPS,即每秒浮点运算次数, 是每秒所执行的浮点运算次数(Floating-point operations per second;缩写:FLOPS)的简称,用来评价CPU的算力.
MAC/FMA的全称为Fused Multiply–accumulate operation, 也就是乘积累加指令,这种指令集融合了加法和乘法,使得处理器能够在一个指令中同时完成乘法和加法操作,从而提高了计算效率。
SIMD的全称叫做,单指令集多数据(Single Instruction Multiple Data)。最直观的理解就是,向量计算。比如一个加法指令周期只能算一组数(一维向量相加),使用SIMD的话,一个加法指令周期可以同时算多组数(n维向量相加),二者用时基本相等,极大地提高了运算效率。
原文链接:https://blog.csdn.net/qq_51563654/article/details/131161576
1 TFLOPS = 10^3 GFLOPS = 10^6 MFLOPS = 10^12 FLOPS
FLOPS=核数*单核主频*单个周期浮点计算值
单个周期浮点计算值(双精度)=FMA数量*2(同时加法和乘法)*512/64
单个周期浮点计算值(单精度)=FMA数量*2(同时加法和乘法)*512/32
单精度和双精度浮点运算概念,简单的理解单精度就是指32bit的指令长度的运算,对应操作系统就是32位操作系统;双精度就是指64bit指令长度的运算,对应操作系统就是64位操作系统。
512:这个数值可能指的是CPU的某些硬件特性,如SIMD(Single Instruction, Multiple Data)宽度。SIMD宽度是CPU能够同时处理的数据元素数量。