深度学习CNN

最新推荐文章于 2024-08-11 06:00:00 发布

石头ape

最新推荐文章于 2024-08-11 06:00:00 发布

阅读量1.8k

点赞数 1

分类专栏：深度学习算法文章标签：深度学习 cnn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52662631/article/details/122224453

版权

深度学习算法专栏收录该内容

3 篇文章 0 订阅

订阅专栏

CNN经常被用于图像识别，语音识别等场景；在图像识别中，它的主要用于特征提取，还可用于关键点定位以此来判断人的各种动作。

与神经网络不同的是，CNN多了卷积层和池化层，卷积层用于提取特征，池化层用于特征浓缩；除此之外，在CNN中也有一个关于“深度”的概念，可以将CNN看成有三维形状（3个通道）的神经网络。

例如输入层输入一个32*32*3（h*w*通道）个像素点的图片，32*32表示图片的像素点，3表示输入图片是彩色3维，即RGB=3，卷积层在提取特征时，首先要设置n个filter用于卷积计算，此时filter的维度要和图片的维度保持一致，例如filter=5*5*3；卷积计算完成后将会得到n个特征图（设置了几个filter就会得到几个特征图）

在卷积计算前，可以设置边界填充pad，例如pad=1，就是在原始输入矩阵加上一圈0元素，这样做是为了调整输出的大小，防止输出的特征图只有1行1列而无法进行下一次的卷积运算。在卷积计算的过程中，3维的像素点矩阵分别与3维的filter矩阵卷积计算，计算完成后的三个值相加得到最终该区域的卷积和；除此之外还要设置滑动步长stride的值，它表示下一与filter矩阵计算的区域应要移动的距离；计算完成后将会得到n维的特征图，每一维的特征图都是3个通道输入矩阵分别与三维filter矩阵卷积计算求和。

卷积完成后的特征图的长宽：

h1=(h0-filter_size+2pad)/stride + 1;

w1=(w0-filter_size+2pad)/stride + 1;

池化层用于将特征图的特征浓缩，主要方式有mean pooling，max pooling，这方面知识比较简单，也称下采样。

权值共享：假如每个神经元都相互连接（全连接），那么需要设置的参数太过庞大，通过权值共享，每一个与filter计算的区域都共享权值，那么只需考虑一个区域需要设置的参数，filter矩阵的长宽深度的乘积，即5*5*3个参数。

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。