异构计算
记得努力o
这个作者很懒,什么都没留下…
展开
-
CPU峰值性能计算方法
最近在整cpu的CNN推理性能优化,不可避免的要清楚CPU的性能峰值在哪里,因此要算峰值算力,在查的时候发现很多人都说的不对。CPU的峰值算力主要是从以下几个方面考虑:FMA乘加运算、Turbo frequency、CPI、CPU core、SIMD。FMA乘加运算:算关于cnn的算力都是算乘加的性能的,流水线后乘法和加法能够并行运算,所以算力乘2既可。 Turbo frequency:Turbo是intel的自动超频技术,intel cpu会根据任务量自动调整频率,用的core越少,频率会越高。原创 2020-09-06 19:44:38 · 8837 阅读 · 4 评论 -
cuda 矩阵乘法加速
在实验室做的方向时是异构加速,基于FPGA加速CNN,用xilinx的hls和sdsoc环境,但是找工作方向这两开发环境真就没啥企业在用,所以就近学学cuda,gpu加速。为什么是先做矩阵乘法是基于做了挺长一段时间的CNN加速来考虑的 矩阵乘法是神经网络的核心所在https://blog.csdn.net/lanchunhui/article/details/74838635。cpu计算...原创 2019-08-30 16:20:31 · 2905 阅读 · 2 评论