梯度下降法

最新推荐文章于 2024-08-08 20:24:08 发布

小蘑菇LC

最新推荐文章于 2024-08-08 20:24:08 发布

阅读量508

点赞数

分类专栏：机器学习文章标签： logistic回归成本函数梯度下降参数优化凸函数

本文链接：https://blog.csdn.net/lycu_/article/details/122144463

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

在前面一篇文章我们介绍了logistic线性回归
预测值： $\hat y$ = $\sigma$ ( $w^T$ +b)
$\sigma$ (z)= $\frac{1}{1+e^{-z}}$
cost函数：J(w , b)= $\frac{1}{m}$ $\displaystyle\sum_{i=1}^{m} L(\hat y^{(i)},y^{(i)})$
=- $\frac{1}{m}$ $\displaystyle\sum_{i=1}^{m} [y^{(i)}\log^{\hat y^{(i)}}+(1-y^{(i)})\log^{1-\hat y^{(i)}}]$
cost函数衡量参数w和b在训练集上的效果，因此我们需找到使J(w , b)尽可能小的w和b
对于logistic回归而言，因为函数是凸的，无论初始化值是什么，最后都应该到达同一点或大致相同的点。

梯度下降法

梯度下降法所做的就是从初始点开始，朝最陡的方向走一步
如下图所示，红色箭头是该点斜率的方向，即该点最陡的方向，沿着该方向能最快到达最低点。
在这里插入图片描述
由此，我们可以得到

Repeat{
w:=w- $\alpha$ $\frac{dJ(w)}{dw}$
b:=b- $\alpha$ $\frac{dJ(b)}{db}$
}
其中， $\alpha$ 控制步长，这个步长既不能太大也不能太小。
太大有可能无法到达最小值；太小可能到达最小值的时间太长。
上面高亮文字中的倒数为偏导数，有兴趣的同学可以自己算，或在下方评论。
有不对的地方。欢迎指正！

小蘑菇LC

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
梯度下降法

在前面一篇文章我们介绍了logistic线性回归y^\hat yy^=KaTeX parse error: Undefined control sequence: \xigma at position 1: \̲x̲i̲g̲m̲a̲
复制链接

扫一扫

专栏目录