Logistic Regression梯度下降使用证明

最新推荐文章于 2022-08-25 18:22:18 发布

Liu_Genie

最新推荐文章于 2022-08-25 18:22:18 发布

阅读量200

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Mophistoliu/article/details/79689840

版权

机器学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

最近在看机器学习实战，其中有些代码部分容易让人摸不着头脑。主要是代码里面把原理细节的东西隐藏了，为了更好地理解Logistic Regression，在这篇博客记录一下推导过程。

首先是Logistic Regression的损失函数(loss function): 其中y为实际值，a为计算值。

$L(y, a) = -[y*ln(a) + (1-y)*ln(1-a)]$

对于单个例子 $x_i = (x_{i1}, x_{i2}... , x_{in})$ 和 $w^T = (w_{1}, w_{2}... , w_{n})$ 有:

$a = sigmoid(x_i*w)$ 其中 $sigmoid(x) = \frac{1}{1+e^{-x}}$

对于 $w$ 中的 $w_j$ 来说，有以下链式求导：

$\frac{\partial{L(y, a)}}{\partial{w_j}} = \frac{\partial{L(y,a)}}{\partial{a}}\frac{\partial{a}}{\partial{(x_i*w)}}\frac{\partial{(x_i*w)}}{\partial{w_j}}$

其中 $\frac{\partial{L(y,a)}}{\partial{a}} = -\frac{(y-a)}{a(1-a)}$

对于sigmoid函数来说有 $g'(x) = g(x)(1-g(x))$ 故上述式子可 $\frac{\partial{a}}{\partial{(x_i*w)}} = a(1-a)$

最后 $\frac{\partial{(x_i*w)}}{\partial{w_j}} = x_{ij}$

所以 $\frac{\partial{L(y, a)}}{\partial{w_j}} = -(y-a)x_{ij}$

推广到多例子的 $w$ 有：
$\frac{\partial{L(y, a)}}{\partial{w}} = -X^T*(y-a)$

故对 $w$ 的更新为以下式子：

$w = w + X^T(y-a)$

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Logistic Regression梯度下降使用证明

最近在看机器学习实战，其中有些代码部分容易让人摸不着头脑。主要是代码里面把原理细节的东西隐藏了，为了更好地理解Logistic Regression，在这篇博客记录一下推导过程。首先是Logistic Regression的损失函数(loss function): 其中y为实际值，a为计算值。L(y,a)=−[y∗ln(a)+(1−y)∗ln(1−a)]L(y,a)=−[y∗ln(a)+(...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。