激活函数、BP反向传播算法、三种梯度下降、softmax函数及其推导

  1. 激活函数的作用:
    由于我们使用的神经网络分类器是线性方程,如w1x1+w2x2+…+wnxn + bi= 0,这种方程所划分的区域总是直线类似的/折线,这种划分不能很好的划分曲面形状,所以通过引入激活函数,这种激活函数不同于一次函数,它是一种曲线,由此划分出来的界限或者高维界面就是一种曲线或者曲面,能够更好的拟合分解。
    参考文章:形象的解释神经网络激活函数的作用是什么?

  2. BP方向传播算法:
    这里面的主要原理是梯度下降算法,记住梯度的反方向是下降最快的方向。设权重为w,输出为yout,输出对比值为y,误差为C=(yout-y),则推导:w->yout->C;得C是w的函数,通过C对w取梯度导数,得到最大下降方向,设导数为d(w),则更新权值w=w-d(w);以此类推,向前传播。
    参考链接:通俗理解神经网络BP传播算法

  3. 三种梯度下降:

    • 批量梯度下降(BGD):计算所有的样本来对权值进行更改。可以直接向着极小值下降,但是计算量大,速度慢。
    • 随机梯度下降(SGD):随机选取一个样本进行权值更新,虽然不像批量这样直接向着极小值下降,但是总体来说也是渐渐向着最优处下降。同时由于计算量少,计算速度很快
    • 小批量梯度下降(MBGD):每次只是选取一批样本进行权值更新,样本大小batch根据需要自己改变。这样既减少了计算量,又尽可能的向着极小值下降。
      参考链接:详解梯度下降法的三种形式BGD、SGD以及MBGD
  4. softmax函数的作用和推导:
    sigmoid是用来而分类的,softmax用来多分类;softmax用于多分类过程中,它将多个神经元的输出,映射到(0,1)区间内,并将每个类别出现的次数的多少作为选取的目标,而不是只选取最多的那个,这样更显公平。可以看成概率来理解,从而来进行多分类!
    参考链接:通俗详解softmax函数及其求导过程

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值