平均梯度、信息熵、brenner梯度函数和能量函数_梯度下降算法（Gradient Descent)的原理和实现步骤...

最新推荐文章于 2024-06-21 17:25:48 发布

feichenpan

最新推荐文章于 2024-06-21 17:25:48 发布

阅读量2.2k

点赞数 1

文章标签：平均梯度、信息熵、brenner梯度函数和能量函数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_30539317/article/details/113668556

版权

大部分的机器学习模型里有直接或者间接地使用了梯度下降的算法。虽然不同的梯度下降算法在具体的实现细节上会稍有不同，但是主要的思想是大致一样的。梯度下降并不会涉及到太多太复杂的数学知识，只要稍微了解过微积分里导数的概念，就足够完全理解梯度下降的思想了。

梯度下降的目的

绝大多数的机器学习模型都会有一个损失函数。比如常见的均方误差（Mean Squared Error)损失函数：

$equation?tex=L%28w%2Cb%29+%3D%5Cfrac%7B1%7D%7BN%7D%5Csum_%7Bi%3D1%7D%5E%7BN%7D%7B%28y_%7Bi%7D+-+f%28wx_%7Bi%7D+%2B+b%29%29%5E%7B2%7D%7D$ （1）

其中，

equation?tex=y_%7Bi%7D

表示样本数据的实际目标值，

equation?tex=f%28wx_%7Bi%7D+%2B+b%29

表示预测函数

equation?tex=f

根据样本数据

equation?tex=x_%7Bi%7D

计算出的预测值。从几何意义上来说，它可以看成预测值和实际值的平均距离的平方。（关于更多的损失函数的介绍，可以参见这篇文章。）

损失函数用来衡量机器学习模型的精确度。一般来说，损失函数的值越小，模型的精确度就越高。如果要提高机器学习模型的精确度，就需要尽可能降低损失函数的值。而降低损失函数的值，我们一般采用梯度下降这个方法。所以，梯度下降的目的，就是为了最小化损失函数。

梯度下降的原理

寻找损失函数的最低点，就像我们在山谷里行走，希望找到山谷里最低的地方。那么如何寻找损失函数的最低点呢？在这里，我们使用了微积分里导数，通过求出函数导数的值，从而找到函数下降的方向或者是最低点（极值点）。

损失函数里一般有两种参数，一种是控制输入信号量的权重(Weight, 简称

equation?tex=w

），另一种是调整函数与真实值距离的偏差（Bias，简

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
平均梯度、信息熵、brenner梯度函数和能量函数_梯度下降算法（Gradient Descent)的原理和实现步骤...

大部分的机器学习模型里有直接或者间接地使用了梯度下降的算法。虽然不同的梯度下降算法在具体的实现细节上会稍有不同，但是主要的思想是大致一样的。梯度下降并不会涉及到太多太复杂的数学知识，只要稍微了解过微积分里导数的概念，就足够完全理解梯度下降的思想了。梯度下降的目的绝大多数的机器学习模型都会有一个损失函数。比如常见的均方误差（Mean Squared Error)损失函数：（1）其中...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。