谈谈卷积神经网络和循环神经网络

最新推荐文章于 2023-11-30 20:58:08 发布

木木的学习之路

最新推荐文章于 2023-11-30 20:58:08 发布

阅读量6.1k

点赞数 3

分类专栏：机器学习 tensorflow 笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39437164/article/details/118514941

版权

tensorflow 同时被 3 个专栏收录

13 篇文章 3 订阅

订阅专栏

8 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

看起来毫不相关的两种网络，其有哪些近似之处呢？
这篇文章将用简易文字总结。

卷积神经网络-CNN

首先，卷积和神经网络是两个独立模块：

卷积是为了提取特征，卷积核为待求参数，客观世界表现为对图像数据提取特征的方式；
神经网络是工具，通过输入指定维度参量**（这个输入就是源图像经过预处理、反复的卷积-池化降维、激活、全连接等模块所得）**，通过反复迭代，对权重参数运算，使得整个网络在应用于后验数据时，能够很好的匹配上其客观现实中所对应的人为指定标签。

在提取特征时，通常需要一次性的提取多个特征，直观变现为同时存在多层卷积核。

卷积神经网络的一大优点在于权值共享，这样就在待求参数的维度得以释放，不必担心参数爆炸的问题：即不需要图像每个位置特定的特征提取，表现为每个位置一个卷积核。

卷积核共享，就是在一个图像的各个位置，提取特征的方式是一样的。由于单帧图像成像机理和数值范围等在同一个量纲中，因此选取同一种特征提取方式，在后阶段的运算中，其参数的权值也是均衡的。

划重点：这里主要强调了卷积神经网络的卷积核共享，这是一种空间共享特征提取方式。

在这里插入图片描述

循环神经网络-RNN

图片来源：https://zhuanlan.zhihu.com/p/30844905
循环神经网络的工作模式如上图，其主要应用于时间相关的序列参量的运算，具体的网络原理可参照这篇文章理解：
一文搞懂RNN（循环神经网络）基础篇

注意上图，每层的输入为不同时刻所提取的特征，每个时刻的网络输入不仅包含当前提取特征，并且包含前一帧的表现特征，计算模块看就是在网络内部就是隐含层输出向量。

所以这个网络在解决和时间相关的问题时，有着很突出的意义。

循环神经网络也应用了权值共享的策略，也不必担心参数爆炸问题。

为什么会选择权值共享呢？

由于针对时序问题，每帧所输入特征也为同一方式提取，其也具备相同物理含义和相同量纲范围。

划重点：循环神经网络的优势之一在于时间维度的权值共享。

思考

其实至此，已经比较出了这两种网络的近似之处：权值共享。

虽然从客观世界看，这两种网络的输入是风牛马不相及，一个是色彩斑斓的图像，一个是难以表述的时间维度的序列数据；
但是结合网络模式，其都存在着在各自维度的权值共享方案，也都符合其数据机理。

时空，其在某个维度看，也是一种和谐统一。

木木的学习之路

关注

3
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
谈谈卷积神经网络和循环神经网络

看起来毫不相关的两种网络，其有哪些近似之处呢？这篇文章将用简易文字总结。卷积神经网络-CNN首先，卷积和神经网络是两个独立模块：卷积是为了提取特征，卷积核为待求参数，客观世界表现为对图像数据提取特征的方式；神经网络是工具，通过输入指定维度参量**（这个输入就是源图像经过预处理、反复的卷积-池化降维、激活、全连接等模块所得）**，通过反复迭代，对权重参数运算，使得整个网络在应用于后验数据时，能够很好的匹配上其客观现实中所对应的人为指定标签。在提取特征时，通常需要一次性的提取多个特征，直观变现为
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。