逻辑回归

ttinch

于 2020-05-12 23:07:28 发布

阅读量168

点赞数

分类专栏：机器学习文章标签：逻辑回归机器学习

本文链接：https://blog.csdn.net/ttinch/article/details/106086848

版权

机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

逻辑回归

1. 逻辑回归模型
2. 损失函数
3. 损失函数求解
- 3.1 梯度下降法
- 3.2 牛顿法
4. 为什么sigmoid输出代表概率
5. 共线性问题

1. 逻辑回归模型

逻辑回归将线性回归的预测值转换为0/1值，通常采用sigmoid函数 $g(z)=\frac{1}{1+e^{-z}}$ 进行转换：
$h(x)=\frac{1}{1+e^{-(\omega^Tx+b)}}$
即
$\begin{aligned} P(y=1|x)&=\frac{1}{1+e^{-(\omega^Tx+b)}}\\ &=\frac{e^{\omega^Tx+b}}{1+e^{\omega^Tx+b}} \end{aligned}\\ P(y=0|x)=\frac{1}{1+e^{\omega^Tx+b}}$

2. 损失函数

最大化对数似然函数
$\begin{aligned} L(\omega,b)&=\sum_{i=1}^m\ln P(y_i|x_i;\omega,b)\\ &=\sum_{i=1}^m\ln(y_iP_1(x_i;\omega,b)+(1-y_i)P_0(x_i;\omega,b))\\ &=\sum_{i=1}^m(y_i\ln h(x_i)+(1-y_i)\ln(1-h(x_i))) \end{aligned}$
损失函数为
$E(\omega,b)=-\sum_{i=1}^m(y_i\ln h(x_i)+(1-y_i)\ln(1-h(x_i)))$

3. 损失函数求解

3.1 梯度下降法

令 $\hat{\omega}=(\omega;b)$
$\begin{aligned} E(\hat{\omega},b)&=-\sum_{i=1}^m(y_i\ln h(x_i)+(1-y_i)\ln(1-h(x_i)))\\ &=-\sum_{i=1}^m(y_i(\omega^Tx_i+b)-\ln(1+e^{\omega^Tx_i+b}))\\ &=-\sum_{i=1}^m(y_i\hat{\omega}^Tx_i-\ln(1+e^{\hat{\omega}^Tx_i}))\\ \frac{\partial E}{\partial \hat{\omega}}&=-\sum_{i=1}^m(y_ix-\frac{e^{\hat{\omega}^Tx}}{1+e^{\hat{\omega}^Tx}} x)\\ &=\sum_{i=1}^m(h(x_i)-y_i)x_i\\ &=X^T(h(X)-Y) \end{aligned}$
其中 $X$ 为为 $m\times n$ 维的矩阵， $m$ 代表样本的个数， $n$ 代表样本的特征数。参数更新公式为：
$\hat{\omega}=\hat{\omega}-\alpha X^T(h(X)-Y)$

3.2 牛顿法

4. 为什么sigmoid输出代表概率

参见广义线性模型推导过程

5. 共线性问题

ttinch

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
逻辑回归

逻辑回归1. 逻辑回归模型2. 损失函数3. 损失函数求解3.1 梯度下降法3.2 牛顿法4. 为什么sigmoid输出代表概率5. 共线性问题1. 逻辑回归模型逻辑回归将线性回归的预测值转换为0/1值，通常采用sigmoid函数g(z)=11+e−zg(z)=\frac{1}{1+e^{-z}}g(z)=1+e−z1进行转换：h(x)=11+e−(ωTx+b)h(x)=\frac{1}{1+e^{-(\omega^Tx+b)}}h(x)=1+e−(ωTx+b)1即P(y=1∣x)=11+e−
复制链接

扫一扫