分类问题常用算法——逻辑回归原理

pyx1212

已于 2022-02-14 15:02:50 修改

阅读量1.6k

点赞数 3

分类专栏：经典永不过时——机器学习文章标签：算法分类逻辑回归

于 2022-02-14 11:50:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38100666/article/details/122914271

版权

经典永不过时——机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

逻辑回归模型算是机器学习的一种基本方法，但也有很多细节。本篇文章从原理入手，力求化繁为简，如有错漏，烦请指正。

什么是逻辑回归：

逻辑回归是一种分类模型。给定输入X，可以将Y的条件概率P(Y|X)形式化为logistic分布。具体地讲，以二分类为例，逻辑回归模型为：

$P(Y=1|x) = \frac{1}{1+e^{-wx}}=\frac{e^{wx}}{1+e^{wx}}$

$P(Y=0|x) = \frac{e^{-wx}}{1+e^{-wx}}=\frac{1}{1+e^{wx}}$

对于逻辑回归模型，给定x，根据以上两个式子求得P(Y=1|x)和P(Y=0|x)，比较两个概率大小，然后将x分类为概率最大的一类。

p为一个事件发生的概率，则一个事件发生的几率为p/(1-p)，而：

$ln\frac{P(Y=1|x)}{1-P(Y-1|x)} = wx$

可以看出逻辑回归的特点，输出Y=1的几率为输入x的线性函数。

损失函数：

$\pi(x) = P(Y=1|x),1-\pi(x)=P(Y=0|x)$

似然函数为：

$\prod_{i=1}^{N}\pi(x_i)^{y_i}(1-\pi(x_i))^{1-y_i}$

对数似然函数为：

$L(w) = \sum_{i=1}^{N}[y_i ln\pi_i+(1-y_i)ln(1-\pi_i)]$

$=\sum_{i=1}^{N}[y_iln\frac{\pi(x_i)}{1-\pi(x_i)}+ ln(1-\pi(x_i))]$

$=\sum_{i=1}^{N}[y_i (w x_i)-ln(1+exp(wx_i))]$

损失函数为负平均对数似然：

$J(w)=-\frac{1}{N}L(w)$

在逻辑回归中，最小化损失函数即为最大化对数似然

求解：

主要求解方法：梯度下降法（随机梯度下降、mini-batch梯度下降等），牛顿法等

1.随机梯度下降：

$g=\frac{\partial J}{\partial w}=x_i(\pi(x_i)-y_i)$

$w^{k+1}=w^k-\alpha g$

2.牛顿法：

基本思路是在现有极小估计点附近做二阶泰勒展开，得到导数为0的点进行一个更新，直到达到要求。设 $w_k$ 为目前的极小估计点：

$\varphi (w)=J(w^k)+J'(w^k)(w-w^k)+\frac{1}{2}J''(w^k)(w-w^k)^2$

令 $\varphi '(w)=0$ ，可得：

$w^{k+1} = w^k-\frac{J'(w^k)}{J''(w^k)}=w^k-H_k^{-1}\cdot g_k$

其中 $H_k$ 为海森矩阵

缺点：牛顿法是定长迭代，没有步长因子，所以不能保证函数值稳定的下降。牛顿法要求函数一定是二阶可导的。而且计算Hessian矩阵的逆复杂度很大。

所以提出拟牛顿法，用一个特别的表达形式来模拟Hessian矩阵或者是他的逆使得表达式满足拟牛顿条件。主要有DFP法（逼近Hession的逆）、BFGS（直接逼近Hession矩阵）、 L-BFGS（可以减少BFGS所需的存储空间）。

正则化：

1、L1正则（LASSO回归）：

对参数增加一个先验，服从零均值拉普拉斯分布：

$f(w|\mu,b)=\frac{1}{2b}exp(-\frac{|w-\mu|}{b})$

所以负对数似然变为：

$-lnL(w) = -\sum_{i=1}^{N}[y_iln\pi(x_i)+(1-y_i)ln(1-\pi(x_i))]+\lambda \sum_{j=1}^{d}|w_j|$

2、L2正则（Ridge回归）：

对参数w增加一个先验，服从零均值正态分布：

$f(w|\mu ,\sigma )=\frac{1}{\sqrt{2\pi}\sigma}exp(-\frac{(w-\mu)^2}{2\sigma^2})$

负对数似然为：

$-lnL(w) = -\sum_{i=1}^{N}[y_iln\pi(x_i)+(1-y_i)ln(1-\pi(x_i))]+\lambda \sum_{j=1}^{d}w_i^2$

3、作用与区别

控制模型复杂度，惩罚过大的参数来防止过拟合。L1正则化可以产生稀疏权值矩阵，从而可以进行特征选择。

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
分类问题常用算法——逻辑回归原理

逻辑回归模型算是机器学习的一种基本方法，但也有很多细节。本篇文章从原理入手，力求化繁为简。
复制链接

扫一扫

专栏目录

pyx1212 CSDN认证博客专家 CSDN认证企业博客

码龄7年

30: 原创

73万+: 周排名

18万+: 总排名

5万+: 访问

: 等级

346: 积分

478: 粉丝

34: 获赞

13: 评论

101: 收藏

私信

关注

热门文章

分类专栏

最新评论

Dataloader中pin_memory参数的使用及注意事项
纵风弄云真君: 在PyTorch中，当pin_memory参数设置为True时，数据加载器（DataLoader）会将从数据集加载的数据存储在内存中的固定页（pinned memory）中，而不是普通的内存中。这样做的主要目的是为了加速数据传输，尤其是在数据加载到GPU之前的数据传输过程中。具体来说，当pin_memory设置为True时，数据加载器会将数据加载到固定页中，而GPU可以直接访问固定页中的数据，而不需要经过额外的数据拷贝操作。这样可以减少数据从主机内存到GPU显存的拷贝次数，从而减少数据传输的时间，提高训练过程中数据加载的效率。总的来说，通过将数据加载到固定页中，可以减少数据传输过程中的额外开销，提高数据加载的效率，从而在一定程度上加快训练速度。特别是在数据加载操作相对耗时的情况下，设置pin_memory为True可以更好地利用硬件资源，提高训练效率。 AI回答的，人家博主倒是没说反，就是不是很清楚，普通人不会知道CPU内存还有什么固定页吧
Dataloader中pin_memory参数的使用及注意事项
weixin_50596351: 确实离谱
pytorch中scatter函数的用法
zhangx1984: 第五步得到的结果根本就不对，正确的应该是 tensor([[ 1., 14., 11., 8.], [ 5., 2., 15., 12.], [ 9., 6., 3., 16.], [13., 10., 7., 4.]], dtype=torch.float64)
pytorch中scatter函数的用法
pyx1212: 奥是的，已改~
pytorch中scatter函数的用法
Yorlen_Zhang: dim=0表示逐列进行行填充，而dim=1表示逐列进行行填充这里是不是写错了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。