CNN（卷积神经网路）个人理解

二月的夕雀

于 2024-03-21 18:27:08 发布

阅读量1.3k

点赞数 21

文章标签： cnn 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_54407673/article/details/136907854

版权

本文详细介绍了卷积神经网络中的关键组件，包括多输入通道的处理、卷积层的矩阵运算、激活函数提升非线性特征、池化层的下采样作用以及全连接层的权重计算。重点阐述了权值更新在CNN训练中的重要性。

摘要由CSDN通过智能技术生成

1.输入层。

（1）多输入（多通道）：将一张彩色图片作为输入，学习其特征。彩色图片通常由三个颜色通道组成，即RGB通道，即3通道图像。

（2）实例说明：将一个图片数据集抽象为四维[数量、长、宽、色彩]，每个维度都是一个通道的概念。例如对于一张 32×32 分辨率的彩色照片来讲，一般将其抽象为向量[1, 32, 32, 3]。

（3）卷积知识：（一次步骤：在3通道卷积核1中，经过3个卷积核进行卷积后，得到的是3个维度的，然后3个维度合并成一个维度，即单通道特征图1）（若想要升维，那就需要n个卷积核进行卷积，即进行多个一次步骤，最后就得到n维，即n通道特征图）

2.卷积层。

（1）卷积本质是矩阵相乘再相加：在每个通道中，均需要一个卷积核进行卷积操作，卷积核实质上就是一个N×N矩阵。如图所示，卷积核就是一个3×3的矩阵。

图片的输入层也是一个矩阵。如下图，卷积操作就是数据窗口的矩阵和卷积核的矩阵相乘再相加得到的。以此来减少特征值数量，加强特征性。

（2）有几个通道就有几个卷积核：值得注意的是，因为一个图片有多个通道的输入，每个卷积核只能处理一个通道。因此，有几个通道就需要有几个卷积核。

3.激活函数。

（1）非线性（更高维）：神经网络能通过激活函数获取更高维的特征，意味着神经网络可以学习到更加抽象和复杂的特征表示，这些特征可以在更高维的空间中区分不同类别的数据。

（2）举例说明：当没有激活函数时，只能处理线性问题。如下图，y = ax+b ，(x+y)² = r²

应用激活函数后，可以对空间进行升维，在更高维度学习特征。此时线性不可分。

（3）自我理解：讲解激活函数时，多用分类问题来讲解。需要知道的是，分类并不是学到的特征，而是一种应用场景，用来说明神经网络如何通过激活函数和更高维的特征表示来实现分类任务。

你可以理解，神经网络通过激活函数在更高维发现了一个特征，它把这个特征给一个特征1的标签。当下次它在遇到相同的特征时，就自然而然的将它往特征1上靠拢，从而进行分类和识别。至于网络怎么理解这个特征、学到了什么特征，其实不需要想太多。

4. 池化层

（1）作用：池化层的作用是对输入的特征图进行下采样，减少参数数量，降低计算复杂度，并增强模型的鲁棒性。

（2）池化与卷积的区别：池化不进行矩阵运算，而卷积进行。

平均值池化：将矩阵内的值求和取均值

最大值池化：取矩阵中的最大值

5.全连接层

（1）如图，经过上述步骤得到5维输出。

（2）首先，需要将这个3×3×5的输出转换为 1×4096的形式，因此需要进行卷积。

这里，我们用一个3x3x5的filter 去卷积输出，然后sum求和，得到的结果就是一个神经元的输出。因为有4096个输出，因此需要4096个上述的filter 。

（3）全连接时，每一个线都有一个权重。通过矩阵相乘就能得到10个结果的概率值。

（4）难点：权值的更新。

卷积神经网络（CNN）的训练过程、权值更新_cnn训练-CSDN博客

二月的夕雀

关注

21
点赞
踩
33

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

二月的夕雀 CSDN认证博客专家 CSDN认证企业博客

码龄4年

13: 原创

137万+: 周排名

12万+: 总排名

1万+: 访问

: 等级

343: 积分

139: 粉丝

211: 获赞

6: 评论

244: 收藏

私信

关注

热门文章

最新评论

Mamba
CSDN-Ada助手: 恭喜您发布第12篇博客《Mamba》！您的持续创作精彩纷呈，让读者们享受到了无限的阅读乐趣。希望您能继续保持写作的热情和创造力，不断挑战自我，探索更多新颖的主题和观点。期待您的下一篇作品，相信您会取得更大的进步和成就。加油！
pyskl 骨架动作识别（手势识别）
m0_74397345: 请问有更加详细数说明吗
pyskl目录讲解
CSDN-Ada助手: 恭喜您发布第四篇博客“pyskl目录讲解”！持续创作是非常了不起的事情，您的努力和热情让读者受益良多。接下来，我建议您可以考虑深入探讨pyskl目录的应用场景，或者分享一些实际案例，让读者更好地理解和运用这个工具。期待您的下一篇作品！祝您越来越好！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
CNN（卷积神经网路）个人理解
CSDN-Ada助手: 恭喜您写了第三篇博客，标题为“CNN（卷积神经网络）个人理解”！阅读您的博客，我对CNN的理解有了更深入的认识，感谢您分享这些知识。希望您能继续坚持创作，分享更多关于神经网络和深度学习的内容。下一步的创作建议是可以结合实际案例或者代码展示，让读者更直观地了解CNN的应用和实现过程。期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
pytorch学习中 “ 手写数字识别 ” 问题
CSDN-Ada助手: 非常棒的博文！你对解决手写数字识别问题的方法进行了详细的介绍，让读者可以按照你提供的路径进行操作。我很期待你的下一篇博文！除了你提到的解决方法，还有一些与手写数字识别相关的扩展知识和技能，或许可以帮助到你。首先，你可以了解一下卷积神经网络（Convolutional Neural Networks，CNN）的原理和应用，因为它在图像识别领域有着广泛的应用。其次，你可以学习一下数据增强（Data Augmentation）的方法，通过对训练数据进行一些变换和扩充，可以提高模型的泛化能力。最后，你还可以尝试使用其他的深度学习框架，比如TensorFlow或Keras，来进行手写数字识别的实践。希望我的建议对你有所帮助，继续努力创作吧！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。