5、多层感知机（MLP）

最新推荐文章于 2024-07-02 21:28:54 发布

你看起来很好吃

最新推荐文章于 2024-07-02 21:28:54 发布

阅读量5.2k

点赞数 1

分类专栏： TensorFlow

本文链接：https://blog.csdn.net/u010745111/article/details/62217464

版权

有理论研究表明，神经网络隐含层，层数越多，所需要的隐含节点可以越少。

实际使用中，使用层数较深的神经网络会遇到许多困难，比如容易过拟合、参数难以调试，梯度弥散等等。

过拟合：有一种方法叫Dropout，在使用复杂的卷积神经网络训练图像数据时尤其有效，简单说，就是将神经网络某一层的输出节点数据随机丢弃一部分。实质上等于创造出了很多新的随机样本，通过增大样本量、减少特征数量来防止过拟合。

参数难调：拿SGD来举例，不同的学习速率可能会有不同的局部最优解。Adagrad等自适应的方法可以减轻调试参数的负担。

梯度弥散：在ReLu激活函数出现之前，大多用Sigmoid激活函数，但是Sigmoid函数在反向传播中梯度值会逐渐减小，经过多层的传递后会呈指数级急剧减小，这种情况下，根据训练数据的反馈来更新神经网络的参数会非常缓慢。

那么多层神经网络（MLP）有什么用呢？为什么要有隐含层呢？

早期的神经网络没有隐含层，无法解决XOR问题。因为没有隐含层的神经网络是线性的。

TensorFlow实现MLP：

#-*-coding:utf-8-*-
"""
Created on 17/3/17 下午7:24

base Info
"""
__author__ = 'sun'
__version__ = '1.0'

# load data and initial a session
from tensorflow.examples.tutorials.mnist impor

最低0.47元/天解锁文章

你看起来很好吃

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录