1、第一点利用Cache的特点,把大矩阵乘法变成小矩阵的乘法(分治法的思想)
2、计算强度 的消减:比如说 一阵矩阵乘法 = = 15次矩阵加法!
所以可以对分块矩阵从新安排运算次序,减少矩阵乘法(这个思想在编译里面也有)
深度学习矩阵乘法优化算法Strassen
https://www.jianshu.com/p/c1478712b0f5
1、第一点利用Cache的特点,把大矩阵乘法变成小矩阵的乘法(分治法的思想)
2、计算强度 的消减:比如说 一阵矩阵乘法 = = 15次矩阵加法!
所以可以对分块矩阵从新安排运算次序,减少矩阵乘法(这个思想在编译里面也有)
深度学习矩阵乘法优化算法Strassen
https://www.jianshu.com/p/c1478712b0f5