高效卷积算法

最新推荐文章于 2023-09-15 17:05:42 发布

Yellow Yi

最新推荐文章于 2023-09-15 17:05:42 发布

阅读量5.8k

点赞数 3

分类专栏：总结文章标签：卷积加速卷积乘法可分离卷积

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fupotui7870/article/details/79946990

版权

总结专栏收录该内容

2 篇文章 0 订阅

订阅专栏

总结下卷积加速的三种实现方法：

方案一：

卷积等效于使用傅里叶变换将输入与核都转换到复频域，做一个点乘运算，再用逆变换变回到实域，这的确比离散的卷积更快。

方案二：

当卷积核是可以分离的可以拆成一列乘一行的情况（可以用SVD验证一个卷积核是否可拆），将列与输入进行卷积后再把结果与行进行卷积，这种情况做卷积是最快的但是它只是针对特定的卷积核。这里提供大家一个链接里面专门讲解了和对比了这种方法还是在GPU的情况下点击打开链接，我也用pycuda体验过效果是不错就是不很实用，对卷积核限制太死了。

如果卷积核是不可分离的，但是又想快速的实现它可以采用卷积核分解和SVD联系起来，使用SVD中更多的序列保留下来，使得主成分成分保留下来，将这些可以分离的卷积累加起来。这种方法是否有效将取决于SVD分解的大小，重要的奇异值的数量及其他的考虑，例如高速缓存的连贯性和存储单元的局部性。

方案三：

由于矩阵卷积的运算可转换成矩阵乘法进行，具体的原理可以看看这一个帖子点击打开链接，MATLAB的程序点击打开链接，Python的程序点击打开链接，其实这样做只是改变了运算的方式，没有降低运算量。通过这么一转化非常适应使用GPU编程，值得一提的就是直接用离散卷积公式进行GPU加速效果是不大的，我对比过卷积核小的时候还可以，卷积核一大就不行了，不如上述第一种方法好（在CPU下），具体的做法可以看我以前的帖子点击打开链接，我建议想尝试的朋友放弃这种方法。

用矩阵相乘的方法去进行GPU加速是肯定可以的，虽然我没有尝试过但是caffe下卷积乘法是这么做的，如果以后有空还是自己会做下。

这个帖子就是总结下前面的学习经验，有看法的朋友欢迎评论。

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
高效卷积算法

总结下卷积加速的三种实现方法：方案一：卷积等效于使用傅里叶变换将输入与核都转换到复频域，做一个点乘运算，再用逆变换变回到实域，这的确比离散的卷积更快。方案二：当卷积核是可以分离的可以拆成一列乘一行的情况（可以用SVD验证一个卷积核是否可拆），将列与输入进行卷积后再把结果与行进行卷积，这种情况做卷积是最快的但是它只是针对特定的卷积核。这里提供大家一个链接里面专门讲解了和对比了这种方法...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。