[机器学习算法]逻辑回归模型

最新推荐文章于 2024-01-11 00:24:43 发布

TOMOCAT

最新推荐文章于 2024-01-11 00:24:43 发布

阅读量432

点赞数

分类专栏：机器学习算法深入浅出机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TOMOCAT/article/details/93709704

版权

深入浅出机器学习算法同时被 2 个专栏收录

25 篇文章 1 订阅

订阅专栏

机器学习算法

4 篇文章 0 订阅

订阅专栏

写在前头

线性回归模型可以用于回归模型的学习，当我们需要用线性模型实现分类问题比如二分类问题时，需要用一个单调可微函数将线性回归的连续结果映射到分类回归真实标记的离散值上。

推导过程

考虑二分类任务，其输出标记：

$y\in\{0,1\}$
但是线性回归模型产生的预测值是实值z，因此我们需要将实值z转化为0/1的离散值，最理想的函数就是“单位阶跃函数”(unit-step function)：
$\begin{cases} 0,z<0\\ 0.5,z=0\\ 1,z>0\\ \end{cases}$
即当预测值z大于0就判为正例，预测值z小于0就判为负例，预测值为0即可任意判别。
然而单位跃阶函数本身不连续，我们希望找到能在一定程度上近似单位阶跃函数的“替代函数”，并希望它单调可微。对数几率函数(logistic function)正好能满足这个要求：
$y=\frac{1}{1+e^{-z}}$
从而因变量y与自变量x的表达式为：
$y=\frac{1}{1+e^{-(w^Tx+b)}}$
也可以写作：

$ln\frac{y}{1-y}=w^Tx+b$

注：若将y视为样本x作为正例的概率，那么1-y就是其作为反例的概率，那么两者的比值：y/(1-y)称为“几率”(odds)，反映了x作为正例的相对可能性，对几率取对数则得到“对数几率”(log odds,也叫做logit)

由于“对数几率”的取值是实值，因此我们相当于用线性回归方法的预测结果去逼近真实标记的对数几率。

参数估计

前面我们已经解释过y相当于样本x作为正例的概率，那么模型可改写成：

$ln\frac{p(y=1|x)}{p(y=0|x)}=w^Tx+b$
根据：

$p (y = 1 ∣ x) + p (y = 0 ∣ x) = 1$
我们可以得到：

$p(y=1|x)=\frac{e^{w^Tx+b}}{1+e^{w^Tx+b}}$

$p(y=0|x)=\frac{1}{1+e^{w^Tx+b}}$
给定数据集D：

$D=\{(x_i,y_i)\},i=1,2,...,m$
我们通过极大似然法(maximum likelihood method)估计w和b,即令每个样本属于其真实标记的概率越大越好：

$l(w,b)=\sum_{i=1}^{m}lnp(y_i|x_i;w,b)$

逻辑回归优点

直接对分类可能性建模，无需实现假设数据分布，这样就避免了假设分布不准确所带来的问题
不仅能够预测类别，而且可以得到不同分类的概率预测，对许多需利用概率辅助决策的任务很有用。
对率函数是任意阶可导的凸函数，有很好的数学性质

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[机器学习算法]逻辑回归模型

写在前头线性回归模型可以用于回归模型的学习，当我们需要用线性模型实现分类问题比如二分类问题时，需要用一个单调可微函数将线性回归的连续结果映射到分类回归真实标记的离散值上。推导过程考虑二分类任务，其输出标记：y∈{0,1}y\in\{0,1\}y∈{0,1}但是线性回归模型产生的预测值是实值z，因此我们需要将实值z转化为0/1的离散值，最理想的函数就是“单位阶跃函数”(unit-ste...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。