机器学习之逻辑回归

最新推荐文章于 2024-04-07 08:30:42 发布

cqychen

最新推荐文章于 2024-04-07 08:30:42 发布

阅读量312

点赞数

分类专栏：机器学习笔记文章标签：机器学习逻辑回归

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cqy_chen/article/details/77841444

版权

机器学习笔记专栏收录该内容

74 篇文章 1 订阅

订阅专栏

线性回归
逻辑回归

线性回归

给定一组数据集 $=\{(x_1,y_1),(x_2,y_2),(x_3,y_3)......(x_n,y_n)\}$ ,其中 $y\in{R}$ 。我们现在需要找到一个函数来拟合该数据集。函数是线性的时候，可以表示为：

f (x) = W T X + b

$f(x)=W^TX+b$
要拟合这样一条直线，我们的损失函数定义为：

L = \sum i = 1 n (f (x i) - y i) 2 = \sum i = 1 n (w x i + b - y i) 2

$L=\sum_{i=1}^{n}(f(x_i)-y_i)^2=\sum_{i=1}^{n}(wx_i+b-y_i)^2$
我们现在求出使得损失函数最小的w和b。对于这个问题，基本没有任何难度了。直接求导就完事儿了。

\partial L \partial w = 2 * (\sum i = 1 n (w x i + b - y i) * x i) = 2 * (w \sum i = 1 n x 2 i + \sum i = 1 n x i (b - y i))

$\frac{\partial L}{\partial w}=2*(\sum_{i=1}^{n}(wx_i+b-y_i)*x_i)=2*(w\sum_{i=1}^{n}x_i^2+\sum_{i=1}^{n}x_i(b-y_i))$

\partial L \partial b = 2 * \sum i = 1 n (w x i + b - y i) = 2 * (n b + \sum i = 1 n x i (w - y i))

$\frac{\partial L}{\partial b}=2*\sum_{i=1}^{n}(wx_i+b-y_i)=2*(nb+\sum_{i=1}^{n}x_i(w-y_i))$
令其为0即可求得。结果就不说了，大家可以自行去解。
最后拟合成这样一条线：
这里写图片描述

这里写图片描述

逻辑回归

逻辑回归可以看做是线性回归的扩展，因为线性回归是要将 $W^TX+b$ 映射成一个数值，而在逻辑回归中我们将其映射成 $\ln{\frac{y}{1-y}}$ 。即是说：

y = 1 1 + e - ( w x + b ), 这 个 时 候 我 们 的 线 性 模 型 是 逼 近 ln y 1 - y

$y=\frac{1}{1+e^{-(wx+b)}},这个时候我们的线性模型是逼近\ln{\frac{y}{1-y}}$
为啥要逼近这个值呢？我们知道逻辑回归中标记

y∈{1,0} $y\in\{1,0\}$ ,而线性回归中得到的数据是：

wTx+b $w^Tx+b$ 这是一个实数，如何转变成0和1呢，采用最常见的对数几率函数，

y=11+e−z $y=\frac{1}{1+e^{-z}}$ 如下图：
这里写图片描述

这里写图片描述

为啥不用单位越阶函数呢，因为不可导呀。最后其实我们就是想通过线性回归

wTx+b $w^Tx+b$ 转换得到0或者1，通过对数几率函数可以实现，就得到了：

y = 1 1 + e - ( w x + b )

$y=\frac{1}{1+e^{-(wx+b)}}$ 即：

ln y 1 - y = w T x + b

$\ln{\frac{y}{1-y}}=w^Tx+b$
y其实可以看做概率，得到：

P ( y = 1 | x ) P ( y = 0 | x ) = w T x + b

${\frac{P(y=1|x)}{P(y=0|x)}}=w^Tx+b$
则：

P (y = 1 | x) = e w T x + b 1 + e w T x + b

$P(y=1|x)=\frac{e^{w^Tx+b}}{1+e^{w^Tx+b}}$

P (y = 0 | x) = 1 1 + e w T x + b

$P(y=0|x)=\frac{{1}}{1+e^{w^Tx+b}}$
对于概率类的东西，第一个想到的是最大似然法，所以我们的损失函数是负的最大似然。

L = - \prod i = 1 n P (y i | x i; w, b)

$L=- \prod_{i=1}^{n}P(y_i|x_i;w,b)$
要使得损失函数最小，两边取对数，得到：

ln L = - \sum i = 1 n ln P (y i | x i; w, b)

$\ln{L}=- \sum_{i=1}^{n}\ln{P(y_i|x_i;w,b)}$
最小化：

- \sum i = 1 n (y i * P (y i = 1 | x i; w, b) + (1 - y i) * P (y i = 0 | x i; w, b))

$-\sum_{i=1}^{n}(y_i*P(y_i=1|x_i;w,b)+(1-y_i)*P(y_i=0|x_i;w,b))$
这没有办法采用求导的方式，只能采用优化的方法，比如梯度下降或者牛顿法之类。

鄙人写的，程序实现可以参考：
http://blog.csdn.net/cqy_chen/article/details/64479457

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。