01 - LR公式推导

最新推荐文章于 2022-03-07 19:33:16 发布

Pennhhe

最新推荐文章于 2022-03-07 19:33:16 发布

阅读量627

点赞数 1

分类专栏：机器学习&深度学习公式推导

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/huatangzhithree/article/details/89175928

版权

机器学习&深度学习公式推导专栏收录该内容

2 篇文章 0 订阅

订阅专栏

参考于逻辑回归 logistics regression 公式推导

1. 线性回归

$f(x) = w^Tx + b$

消灭常数项

$f(x) = w^Tx$

2. 逻辑回归模型函数

$\sigma(x) = \frac{1}{1 + e^{-x}}$

$\sigma(f(x)) = \sigma(w^Tx) = \frac{1}{1 + e^{-w^Tx}}$

3. 逻辑回归损失函数

$P_{y=1} = \frac{1}{1 + e^{-w^Tx}} = p$

$\begin{cases} p, y=1 \\ 1-p,y=0 \end{cases}$
等价于
$P(y_i|x_i) = p^{y_i}(1-p)^{1-y^i}$
有N组数据 ${(x_1,y_1), (x_2,y_2), (x_3,y_3),(x_4,y_4)......(x_N,y_N)}$ ,合在一起的合事件的概率

$P_{总}=P(y_1|x_1)P(y_2|x_2)P(y_3|x_3)......P(y_N|x_N)\\ =\prod_{n=1}^{N}p^{y_n}(1-p)^{1-y_n}$

$ln(P_{总}) = ln(\prod_{n=1}^{N}p^{y_n}(1-p)^{1-y_n}) \\ = \sum_{n=1}^{N}ln(p^{y_n}(1-p)^{1-y_n}) \\ = \sum_{n=1}^{N}(y_nln(p)+(1-y_n)ln(1-p))$

损失函数是当前模型的输出结果跟实际输出结果之间的差距。这里的损失函数值的等于事件发生的总概率。我们期待损失函数的值最大。

4. 最大似然估计

$F (w)$ 正比于 $P_总$ ， $F (w)$ 只有一个变量 $w$ ，改变 $w$ 的值可以得到不同的 $P_总$ ，当我们选取的 $w^*$ 刚好使 $P_总$ 最大，

就求到了 $w$ 的值 $w^*$ 。
$w^* = \arg\max_{w}F(w) = -\arg\min_{w}F(x)$

5. 梯度推导

$p^{'} =p(1-p)x$

$(1-p)^{'} = -p(1-p)x$

$\Delta F(w) = \sum_{n=1}^{N}(y_n-p)x_n \\ = \sum_{n=1}^{N}(y_n-\frac{1}{1 + e^{-w^Tx_{n}}})x_n$

6. 梯度下降

$w_{t+1} = w_t + \eta\Delta F(w)$

$\eta$ 为步长，学习率。

逻辑回归的损失函数是连续凸函数，只有一个全局最优点。

梯度下降使用可所有的样本点。所有的样本都参与梯度计算。

7. 随机梯度下降

随机梯度下降选择随机选择一个样本，用于代表整体，然后乘以N
$w_{t+1} = w_t + \eta N(y_i - \frac{1}{1 + e^{-w^Tx_i}})$
把 $\eta$ 和 N 合并
$w_{t+1} = w_t + \eta (y_i - \frac{1}{1 + e^{-w^Tx_i}})$

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。