梯度下降法推导总结

最新推荐文章于 2024-07-21 17:05:22 发布

ShadowN1ght

最新推荐文章于 2024-07-21 17:05:22 发布

阅读量1.6k

点赞数

分类专栏：机器学习文章标签：神经网络算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ShadowN1ght/article/details/77746314

版权

本文总结了在人工神经网络训练中，通过梯度下降法不断调整权重以最小化训练误差的过程。讨论了误差平方准则，指出训练误差是权值的函数，并解释了寻找误差超抛物面最低点的原理。最后，介绍了学习速率和权值更新的数学表达，强调其在编程实现中的便利性。

摘要由CSDN通过智能技术生成

在传统人工神经网络ANN的训练过程中，每次迭代的目的就是不断地调整权值w₁,w₂,w₃,...,w_n，使训练样本经过神经网络的实际输出值与目标输出尽可能地接近。

实际输出和目标输出之间的误差度量通常采用如下平方误差准则：

（注：word的向量表达式占多了一个空格的空间，如对排版不满，请多多包涵）

其中，D是训练样本集合（dataset），s是训练样本，T _s是s的目标输出（即s的类别），O _s是s经过神经网络的实际输出。常数因子是为了与推导过程中产生的因子1/2抵消。

现在我们探讨如何使训练误差E最小化。

观察式1-1，对于特定问题，训练集合D是固定的，即T_s是固定的，而O_s只依赖于权值向量w，故训练误差E是权值向量w的函数。

在网络训练过程中，为得到使训练误差E最小化的权值向量w，从任意的权向量w ⁰开始，以很小步长反复修改这个权向量，每一步修改都使误差E减小，直到找到使E合理最小化的权向量w ^*。

假设输入点数目为n，则可以将最小化误差E的操作，视为等同于在(n+1)维空间（w⁰~wⁿ构成n维，E构成最后一维ÿ

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。