全连接神经网络的前向计算、反向传播原理

全连接神经网络的权值更新原理推导(前向计算+反向传播)

本问我们首先介绍了全连接神经网络权值更新的基本数学原理——梯度下降算法。之后本问将介绍单层感知机(单输出全连接神经网络)的权值更新原理,从而进一步讲解全连接神经网络权值更新的原理。

1 梯度下降算法

梯度下降算法是一种寻找函数极小值的算法,梯度下降算法将在后文的权值更新中用于求解目标函数的极小值(后文会解释什么是目标函数)。

1.1 梯度

首先需要了解的是:梯度是什么?
梯度是一个向量,函数沿着这个向量的方向,函数值增加的速度最快。梯度中包含函数对各自变量的偏导数。比如对于函数:

  • f ( x , y ) = x 2 + y 2 f (x, y) = x^2 + y^2 f(x,y)=x2+y2

梯度的计算公式为:
g r a d i e n t = ( σ x σ f ( x , y ) , σ y σ f ( x , y ) ) = ( 2 x , 2 y ) gradient = ( \frac{\sigma x}{\sigma f(x, y)},\frac{\sigma y}{\sigma f(x, y)}) = (2x, 2y) gradient=(σf(x,y)σxσf(x,y)σy)=(2x,2y)

1.2 梯度下降算法

由于梯度的方向就是函数增加速度最快的方向,那么梯度的反方向就必然是函数值减少最快的方向。于是,我们可以使得自变量往梯度的反方向变化,这样函数就会逐步靠近最小值(其实不是梯度反方向也可以,只要这个方向是函数值减小的方向就可以)。

于是,比如,对于待优化的函数 f ( w , b ) = w 2 ∗ x + b f (w, b) = w^2*x + b f(w,b)=w2x+b
我们可以得到梯度下降的算法的基本实现步骤:

  1. 初始化一个 w 0 w_0 w0 b 0 b_0 b0的值
  2. 根据 w 1 = w 0 − α 1 ∗ 2 w x w_1 = w_0 - α_1*2wx w1=w0α12wx b 1 = b 0 − α 2 ∗ 1 b_1 = b_0 - α_2*1 b1=b0α21 (α是学习率,可以取0.001)更新 w w w b b b的值
  3. 不断更新直到收敛

2 单输出感知机的权值更新原理

首先定义变量的命名规则,如图所示:
在这里插入图片描述
w w w表示权值,下标表示连接的两个节点在各自层的编号,上标表示连接的上一层的层数。
x x x表示输入值,下标表示该输入在各自层的编号,上标表示所在层的层数。
O O O表示输入值经过激活函数后的值,与 x x x类似下标表示该输入在各自层的编号,上标表示所在层的层数。

单输出感知机的结构如下图所示:
在这里插入图片描述
单层感知机的数学模型为:

x 1 = x 0 ∗ w 0 + x 1 ∗ w 1 + x 2 ∗ w 2 + . . . + x n ∗ w n = ∑ x j ∗ w j x_1 = x_0*w_0 + x_1*w_1 + x_2*w_2 + ... + x_n*w_n = ∑x_j*w_j x1=x0w0+x1w1+x2w2+...+xnwn=xjwj
O 1 = s i g m o i d ( x 1 ) O_1 = sigmoid(x_1) O1=sigmoid(x1)
E = 1 2 ∗ ( O 1 − t 1 ) 2 E = \frac{1}{2}*(O_1 - t_1)^2 E=21(O1t1)2

其中,sigmoid是激活函数(必须选可导的激活函数,不然后面没法求梯度);E是误差函数,是优化的对象;t1是真实值(label)。
对于单层感知机,我们的目标是:输入一个样本(包含x0到xn的特征),模型可以输出准确(或与真实值相近)的O1值。所以在单层感知机中,我们需要对权值 w 0 , w 1 , w 2 , . . . , w n w_0, w_1, w_2, ..., w_n w0,w1,w2

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值