线性回归和逻辑回归

最新推荐文章于 2021-07-25 18:01:28 发布

独步计院

最新推荐文章于 2021-07-25 18:01:28 发布

阅读量507

点赞数

分类专栏：机器学习文章标签：机器学习线性回归逻辑回归

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sjkldjflakj/article/details/51842158

版权

机器学习专栏收录该内容

17 篇文章 0 订阅

订阅专栏

线性回归是为了预测，逻辑回归是为了分类。
线性回归

线性回归的一般形式：

f (x) = w T x + b

$f(x)=\mathbf{w^Tx}+b$

个人理解就是讲数据集中各个离散的点通过 $\mathbf{w^Tx}+b$ 映射到一条直线上。（受到之前讲LDA算法的启发）所以也就是要找到向量w，b

确定w,b关键在于衡量f(x)和真实的y值之间的差距。我们希望差距越小越好，所以采用最小二乘法，最小二乘法就是基于均方误差最小化来进行模型求解的方法

(w *, b *) = a r g m i n \sum i = 1 m (f (x i) - y i) 2

$(w^*,b^*)=arg min\sum_{i=1} ^m(f(x_i)-y_i)^2$

通过求偏导数或者梯度下降算法求得最小值，此处不再赘述

线性模型的预测值还可以逼近真实值y的衍生物。比如

l n y = w T x + b

$ln y =\mathbf{w^Tx}+b$ 就是将线性模型的预测值与指数尺度相对应

y' = w T x + b

$y^{'}=\mathbf{w^Tx}+b$ 那么

y = e y'

$y=e^{y^{'}}$ 也就是将线性模型的预测值映射到了指数函数上。

逻辑回归
正如之前最后所讲的，线性回归模型的预测值也可以映射到逻辑函数上，这样大于0.5的一类，小于0.5的一类，从而达到分类的目的。

y' = 1 1 + e - ( w T x + b )

$y^{'}=\frac{1}{1+e^{\mathbf{-(w^Tx}+b)}}$ 取对数可变化为

l n y ' 1 - y ' = w T x + b

$ln\frac{y^{'}}{1-y^{'}}=\mathbf{w^Tx}+b$
此时形成了线性模型与指数函数的映射关系。y表示了样本x为正例的可能性1-y表示了样本为反例的可能性，重写函数：

y' = p (y = 1 | x) = 1 1 + e - ( w T x + b ) = e w T x + b 1 + e w T x + b

$y^{'}=p(y=1|\mathbf{x})=\frac{1}{1+e^{\mathbf{-(w^Tx}+b)}}=\frac{e^{\mathbf{w^Tx}+b}}{1+e^{\mathbf{w^Tx}+b}}$

(1 - y') = p (y = 0 | x) = 1 1 + e w T x + b

$(1-y^{'})=p(y=0|\mathbf{x})=\frac{1}{1+e^{\mathbf{w^Tx}+b}}$
我们通过极大似然法确定 w,b的值，对于给定的数据集我们希望样本属于它真实标记的概率值越大越好，那么我们需要对数似然模型最大化

l (w, b) = \sum i = 1 m l n (p (y i | x i; w, b))

$l(\mathbf{w},b)=\sum_{i=1}^mln(p(y_i|x_i;\mathbf{w},b))$
因为：

p (y i | x i; w, b) = y i p (y i = 1 | x i; w, b) + (1 - y i) p (y i = 0 | x i; w, b)

$p(y_i|x_i;\mathbf{w},b)=y_ip(y_i=1|x_i;w,b)+(1-y_i)p(y_i=0|x_i;w,b)$ 那么似然函数可以表示为：

l (w, b) = \sum i = 1 m y i l n (p (y i = 1 | x i; w, b)) + (1 - y i) l n (p (y i = 0 | x i; w, b)))

$l(\mathbf{w},b)=\sum_{i=1}^my_iln(p(y_i=1|x_i;w,b))+(1-y_i)ln(p(y_i=0|x_i;w,b)))$
令

β=(w,b),x^=(x,1) $\beta=(\mathbf{w},b),\hat{x}=(\mathbf{x},1)$ 那么，

βTx^=wTx+b $\beta^T\hat{x}=w^Tx+b$ 简化上式并取负值，因为原来的似然函数的目标是样本属于真实值的概率越大越好，取反之后就是需要最小化似然函数

l (β) = \sum i = 1 m (- y i β T x^+ l n (1 + e β T x^))

$l(\beta)=\sum_{i=1}^m(-y_i\beta^T\hat{x}+ln(1+e^{\beta^T\hat{x}}))$
然后就到了最熟悉的梯度下降方法求解了。
这里对每一个

wi $w_i$ 求导

\partial l \partial w i = \sum i = 1 m - y i x i + e β T x ^ 1 + e β T x ^x i

$\frac{\partial{l}}{\partial{w_i}}=\sum_{i=1}^m-y_ix_i+\frac{e^{\beta^T\hat{x}}}{1+e^{\beta^T\hat{x}}}x_i$ 化简：

\partial l \partial w i = \sum i = 1 m (y' i - y i) x i

$\frac{\partial{l}}{\partial{w_i}}=\sum_{i=1}^m(y^{'}_i-y_i)x_i$ 其中

y′i是预测值 $y_i^{'}是预测值$

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。