卷积操作的实现

最新推荐文章于 2024-07-17 12:00:00 发布

kuguadaoren

最新推荐文章于 2024-07-17 12:00:00 发布

阅读量3k

点赞数 2

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kuguadaoren/article/details/80040677

版权

本文探讨了卷积操作在深度学习中的实现，重点介绍了全连接层和卷积层的工作原理。全连接层涉及矩阵与向量的乘法，而卷积层通过im2col方法将3D输入转换为二维数组进行矩阵乘法。高效的GEMM函数在CPU和GPU计算中起到关键作用，确保了卷积和全连接层的高速运算。

摘要由CSDN通过智能技术生成

本文参考 Why GEMM is at the heart of deep learning

BLAS的全称是基础线性代数子程序库（Basic Linear Algebra Subprograms），提供了一些低层次的通用线性代数运算的实现函数，如向量的相加，数乘，点积和矩阵相乘等。BLAS的实现根绝硬件平台的不同而不同，常常利用了特定处理器的硬件特点进行加速计算（例如处理器上的向量寄存器和SIMD指令集），提供了C和Fortran语言支持。
不同的厂商根据自己硬件的特点，在BLAS的统一框架下，开发了自己的加速库，Intel的MKL，ATLAS和OpenBLAS。其中后面的三个均可以在Caffe中配置使用。
在BLAS中，实现了矩阵与矩阵相乘的函数gemm（GEMM: General Matrix to Matrix Multiplication）和矩阵和向量相乘的函数gemv，这两个数学运算的高效实现，关系到整个DL 框架的运算速度。

可以看到，在前向计算过程中，无论是CPU还是GPU，大量时间都花在了卷积层和全连接层上。

全连接层

对于全连接层的操作为输出神经元需要和输入相乘并求和得出输出，其过程如下图所示࿱

最低0.47元/天解锁文章

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。