对数几率回归——Logistics Regression原理

最新推荐文章于 2024-06-25 22:54:21 发布

稚与

最新推荐文章于 2024-06-25 22:54:21 发布

阅读量2.8k

点赞数 1

分类专栏： Machine learning 文章标签：机器学习逻辑回归人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45698935/article/details/105971342

版权

Machine learning 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

Logistic Regression

简介

对数几率回归，也称为逻辑回归，虽然名为“回归”，但实际上是分类学习方法。

优点

不仅可以预测类别，还可以得到近似概率，对许多需要利用概率辅助决策的任务很有用。
直接对分类可能性建模，无需考虑数据分布的问题。
对率函数任意阶可导，有很好的数学性质

缺点

特征空间较大时，性能表现不好
容易欠拟合，一般准确率不高
只适用线性可分问题

基本原理

分类函数

考虑二分类任务，输出类别标记为 ${0, 1\}$ ，要将线性回归模型产生的预测值 $z$ 转换为0/1值，可以使用单位越阶函数，即

$\begin{cases} 0 & \text{z<0} \\ 0.5& \text{z=0} \\ 1& \text{z>0} \end{cases}$

但是单位越阶函数并非连续可微，因此不能作为联系函数。于是改用对数几率函数，也称sigmoid函数，即

$y=\frac 1 {1+e^{-z}}$

从概率的角度思考

以sigmoid函数为联系函数带入到线性模型中，变化为

$ln\frac y{1-y}=w^Tx+b$

在这个模型中，将 $y$ 视作样本分类为正的可能，则 $1 - y$ 为反例的可能，两者的比值即为**“几率”**，再取对数即为所谓对数几率。

故可将上式重写为

$ln\frac{p(y=1|x)}{p(y=0|x)}=w^Tx+b$

同时有 $p(y=1|x)=\frac {e^{-(w^tx+b)}}{1+e^{-(w^tx+b)}}$ 、 $p(y=0|x)=\frac {1}{1+e^{-(w^tx+b)}}$ 。

损失函数

为了回归学习出参数 $w$ 和 $b$ ，需要选择合适的损失函数，先直接给出对数几率回归中使用的损失函数，即对数损失：

$L=-[yln\hat y+(1-y)ln(1-\hat y)]$

对数损失是从最大似然函数取对数导出的，最大似然函数即

$l(\theta)=\prod_{i=1}^mp(y=1|x_i)^{y_i}p(y=0|x_i)^{1-y_i}$

当类别y取不同值的时候，此函数总是只有一项发挥作用，可以理解为分段函数：

$L=\begin {cases}-ln(\hat y)& \text{y=1} \\ -ln(1-\hat y) &\text{y=0} \end {cases}$

而由于 $\hat y$ 和 $1-\hat y$ 的值均在0-1之间，故取对数后加负号，使结果为正。此时 $\hat y$ 越接近1，损失函数越小。

梯度下降

学习任务为： $w^*, b^*)=argmin_{w,b}\ L$ ，用链式法则分别求 $L$ 对 $w$ 和 $b$ 的导数，即

$\frac{\partial L}{\partial w}=\frac{\partial L}{\partial \hat y}\frac{\partial \hat y}{\partial z}\frac{\partial z}{\partial w}=(\hat y-y)*x$

$\frac{\partial L}{\partial b}=\frac{\partial L}{\partial \hat y}\frac{\partial \hat y}{\partial z}\frac{\partial z}{\partial b}=\hat y-y$

过拟合

先上图，从左到右分别为欠拟合、适当拟合、过拟合。

这里写图片描述

可以使用正则化方法，对于容易过拟合的特征进行惩罚，即在损失函数中额外加上该特征的惩罚项：

$L(w;x,y)=L(w;x,y)+\alpha \Omega(w)$

reference：

对数几率回归（Logistic Regression）总结

对数几率回归 —— Logistic Regression

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
对数几率回归——Logistics Regression原理

Logistic Regression简介对数几率回归，也称为逻辑回归，虽然名为“回归”，但实际上是分类学习方法。优点不仅可以预测类别，还可以得到近似概率，对许多需要利用概率辅助决策的任务很有用。直接对分类可能性建模，无需考虑数据分布的问题。对率函数任意阶可导，有很好的数学性质缺点特征空间较大时，性能表现不好容易欠拟合，一般准确率不高只适用线性可分问题...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。