03.多层感知机原理&梯度下降算法

多层感知机原理&梯度下降算法

多层感知器(神经网络)

单层神经元的缺陷:无法拟合“异或”运算 (因为输入输出无法线性分割)
因此提出神经网络。

梯度下降原理

一些概念:
梯度:就是表明损失函数的相对参数的变化率
学习速率:对梯度进行缩放的参数被称为学习速率

如何判断学习速率的选取是否合适?
合适的学习速率,损失函数随时间下降,直到一个底部
不合适的学习速率,损失函数可能会发生震荡

那么如何选取学习速率呢?
原则:再调整学习速率时,既要使其足够小,保证不至于发生超调,也要保证其足够大,以使损失函数能够尽快下降,从而可通过较少的次数的迭代更快地完成学习。

局部极值点问题:可通过将权值随机初始化来改善局部极值的问题。权重的初值使用随机值,可以增加从靠近全局最优点附近开始下降的机会(不过现代神经网络并不是一个很严重的问题)

权重是如何调整的?反向传播算法
前馈时,从输入开始,逐一计算每个隐含层的输出,直到输出层
然后开始计算导数,并从输出层经隐藏层逐一反向传播。为了减少计算量,还要对所有已完成计算的元素进行复用。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值