- 博客(2)
- 资源 (2)
- 收藏
- 关注
原创 如何判断算法是否有可优化空间?
计算Armv7a架构理论gflops以及自己写的某个算法的gflops的方法,另外提供了一个脚本可以显示native版矩阵乘法各个尺寸对应的gflops。1. 前言之前一直在写一些算法怎么优化,包括算法逻辑甚至是更加底层一些的文章,但是测试工作都做得比较随意,也就是粗略的比较时间。最近准备学习一下矩阵乘法的优化,觉得这种比较方式实际上是看不出太多信息的,比如不知道当前版本的算法在某块指定硬件上是否还存在优化空间。因此,这篇文章尝试向大家介绍另外一个算法加速的评判标准,即算法的浮点峰值(gflops).
2020-10-26 23:21:04 609
原创 Im2Col+GEMM的改进方法MEC,一种更加高效的卷积计算策略
1. 前言前面介绍了Im2Col+GEMM来实现卷积以在某些条件下获得更好的访存和计算效率,详见:详解Im2Col+Pack+Sgemm策略更好的优化卷积运算 。然后,最近偶然发现了Im2Col+GEMM的一个改进版本即MEC: Memory-efficient Convolution for Deep Neural Network ,这是发表在ICML 2017年的文章,它主要优化了Im2Col+GEMM计算策略中的内存消耗,并且也能提升一点速度,是一个不错的卷积加速算法。所以我在这里结合论文以及代码实
2020-10-10 22:35:21 1362
cs231-斯坦福大学-李菲菲-2016 课件
2018-01-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人