梯度下降法推导总结

本文总结了在人工神经网络训练中,通过梯度下降法不断调整权重以最小化训练误差的过程。讨论了误差平方准则,指出训练误差是权值的函数,并解释了寻找误差超抛物面最低点的原理。最后,介绍了学习速率和权值更新的数学表达,强调其在编程实现中的便利性。
摘要由CSDN通过智能技术生成

在传统人工神经网络ANN的训练过程中,每次迭代的目的就是不断地调整权值w1,w2,w3,...,wn,使训练样本经过神经网络的实际输出值与目标输出尽可能地接近。

实际输出和目标输出之间的误差度量通常采用如下平方误差准则:


(注:word的向量表达式占多了一个空格的空间,如对排版不满,请多多包涵)

其中,D是训练样本集合(dataset),s是训练样本,T s是s的目标输出(即s的类别),O s是s经过神经网络的实际输出。常数因子是为了与推导过程中产生的因子1/2抵消。

现在我们探讨如何使训练误差E最小化。

观察式1-1,对于特定问题,训练集合D是固定的,即Ts是固定的,而Os只依赖于权值向量w,故训练误差E是权值向量w的函数。

在网络训练过程中,为得到使训练误差E最小化的权值向量w,从任意的权向量w 0开始,以很小步长反复修改这个权向量,每一步修改都使误差E减小,直到找到使E合理最小化的权向量w *

假设输入点数目为n,则可以将最小化误差E的操作,视为等同于在(n+1)维空间(w0~wn构成n维,E构成最后一维ÿ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值