从单层感知机到LSTM

最新推荐文章于 2024-07-10 16:28:33 发布

RYP_S

最新推荐文章于 2024-07-10 16:28:33 发布

阅读量3k

点赞数

分类专栏：机器学习深度学习图像处理/计算机视觉文章标签：机器学习深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/renyp8799/article/details/51568488

版权

本文介绍了从单层感知机到深度学习中的关键网络结构，包括多层感知机、DNN、CNN和RNN。讨论了深度学习中遇到的梯度消失问题以及解决方案，如ReLU、ResNet和LSTM。LSTM通过门控机制解决了RNN的长时间依赖问题，增强了对时间序列的建模能力。

摘要由CSDN通过智能技术生成

单层感知机

拥有输入层、隐含层、输出层。输入的特征向量通过隐含层变换达到输出层，在输出层得到分类结果。只能处理很简单的函数。

多层感知机（现在叫神经网络NN）

特点：包含多个隐含层；

使用sigmoid和tanh等连续函数模拟神经元对激励的响应；

使用反向传播BP算法来训练；

摆脱了早起离散传输函数的束缚。

图1上下层神经元全部相连的神经网络——多层感知机

神经网络的层数直接决定了它对现实的刻画能力——利用每层更少的神经元拟合更加复杂的函数。

层数增加带来的问题:

优化函数容易陷入局部最优，偏离真正的全局最优；

性能下降；

“梯度消失”现象严重。

2006年，Hinton利用预训练方法缓解了局部最优解问题，将隐含层推动到了7层。

DNN深度神经网络

克服梯度措施：用ReLU、maxout等传输函数代替了sigmoid，形成了如今DNN的基本形式。单从结构上来说，全连接的DNN和图1的多层感知机没有任何区别。

后来的高速公路网络（highway network）和深度残差学习（deep residual learning）进一步避免了梯度消失，网络层数达到了前所未有的一百多层（深度残差学习：152层）

图2缩减版的深度残差学习网络，仅有34层，终极版有152层

全连接DNN潜在问题：参数数量的膨胀。这不仅容易过拟合，而且极容易陷入局部最优。另外，图像中有固有的局部模式可以利用，应该将图像处理中的概念和神经网络技术相结合。

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。