逻辑回归梯度下降公式详细推导

最新推荐文章于 2024-05-29 09:00:00 发布

wgdzz

最新推荐文章于 2024-05-29 09:00:00 发布

阅读量7.7k

点赞数 10

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/wgdzz/article/details/48816307

版权

机器学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

标签（空格分隔）：机器学习

　　在一次面试中被问道了逻辑回归公式的推导，虽然知道原理，但是从来未从头到尾推导过，面试时估计有点困，又不完全熟悉，又略有紧张（借口找的齐全了…）。面试官还算仁慈，没有太严格。但是自己还是应该会熟练掌握才对的…写此博客，以备复习。

　　假设 $h_{\theta}(x) = \frac{1}{1+exp(-\theta^T x)}$ ，且 $(x^{(i)},y^{(i)})$ 为样本对，共有m个样本。则极大似然函数有：

l (θ) = l o g (\prod i = 1 m h θ (x i) y (i) (1 - h θ (x (i)) 1 - y (i)) = \sum i = 1 m [y (i) l o g (h θ (x i)) + (1 - y (i)) (1 - h θ (x (i))]

$\begin{align} l(\theta)&=log(\prod\limits_{i=1}^m h_{\theta}(x^{i})^{y^{(i)}}(1 - h_{\theta}(x^{(i)})^{1-y^{(i)}}) \\ &=\sum\limits_{i=1}^m [y^{(i)}log(h_{\theta}(x^{i})) + (1-y^{(i)})(1 - h_{\theta}(x^{(i)})] \end{align}$

\partial l ( θ ) \partial θ = \sum i = 1 m [y ( i ) h θ ( x i ) \partial h θ ( x i ) \partial θ + 1 - y ( i ) 1 - h θ ( x i ) \partial h θ ( x i ) \partial θ (- 1)] = \sum i = 1 m [\partial h θ ( x i ) \partial θ (y ( i ) h θ ( x i ) - 1 - y ( i ) 1 - h θ ( x i ))] = \sum i = 1 m [\partial h θ ( x i ) \partial θ (y ( i ) ( 1 - h θ ( x i ) ) + ( y ( i ) - 1 ) h θ ( x i ) h θ ( x i ) ( 1 - h θ ( x i ) ))] = \sum i = 1 m [\partial h θ ( x i ) \partial θ (y ( i ) - h θ ( x i ) h θ ( x i ) ( 1 - h θ ( x i ) ))]

$\begin{align} \frac{\partial l(\theta)}{\partial \theta} &= \sum\limits_{i=1}^m [\frac{y^{(i)}}{h_{\theta}(x^{i})}\frac{\partial h_{\theta}(x^{i})}{\partial \theta} + \frac{1-y^{(i)}}{1-h_{\theta}(x^{i})}\frac{\partial h_{\theta}(x^{i})}{\partial \theta}(-1)] \\ &= \sum\limits_{i=1}^m [\frac{\partial h_{\theta}(x^{i})}{\partial \theta} (\frac{y^{(i)}}{h_{\theta}(x^{i})} - \frac{1-y^{(i)}}{1-h_{\theta}(x^{i})})] \\ &= \sum\limits_{i=1}^m [\frac{\partial h_{\theta}(x^{i})}{\partial \theta}(\frac{y^{(i)}(1-h_{\theta}(x^{i}))+(y^{(i)}-1)h_{\theta}(x^{i})}{h_{\theta}(x^{i})(1-h_{\theta}(x^{i}))})] \\ &=\sum\limits_{i=1}^m [\frac{\partial h_{\theta}(x^{i})}{\partial \theta}(\frac{y^{(i)}-h_{\theta}(x^{i})}{h_{\theta}(x^{i})(1-h_{\theta}(x^{i}))})] \end{align}$

其中，

\partial h θ ( x i ) \partial θ = h θ (x i) (1 - h θ (x i)) x (j)

$\frac{\partial h_{\theta}(x^{i})}{\partial \theta}=h_{\theta}(x^{i})(1-h_{\theta}(x^{i}))x^{(j)}$

化简得：

\nabla θ l (θ) = \partial l ( θ ) \partial θ = \sum i = 1 m （ y (i) - h θ (x i)) x (j)

$\begin{align} \nabla_\theta l(\theta) = \frac{\partial l(\theta)}{\partial \theta} = \sum\limits_{i=1}^m （y^{(i)}-h_{\theta}(x^{i}))x^{(j)} \end{align}$

wgdzz

关注

10
点赞
踩
16

收藏

觉得还不错? 一键收藏
8
评论
逻辑回归梯度下降公式详细推导

标签（空格分隔）：机器学习　　在一次面试中被问道了逻辑回归公式的推导，虽然知道原理，但是从来未从头到尾推导过，面试时估计有点困，又不完全熟悉，又略有紧张（借口找的齐全了…）。面试官还算仁慈，没有太严格。但是自己还是应该会熟练掌握才对的…写此博客，以备复习。　　假设hθ(x)=11+exp(−θTx)h_{\theta}(x) = \frac{1}{1+exp(-\theta^T x)}，且(x(i
复制链接

扫一扫

专栏目录