逻辑回归与二分类

最新推荐文章于 2022-10-24 17:45:42 发布

置顶 hyk今天写算法了吗

最新推荐文章于 2022-10-24 17:45:42 发布

阅读量604

点赞数 1

分类专栏：机器学习与深度学习文章标签：决策树算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_52000372/article/details/123759544

版权

机器学习与深度学习专栏收录该内容

20 篇文章 5 订阅

订阅专栏

目录

一、简介
二、逻辑回归的应用场景
三、逻辑回归的原理
四、逻辑回归API
五、分类的评估方法

一、简介

逻辑回归（Logistic Regression）是机器学习中的一种分类模型，逻辑回归是一种分类算法，虽然名字中带有回归，但是它与回归之间有一定的联系。由于算法的简单和高效，在实际中应用非常广泛。

二、逻辑回归的应用场景

广告点击率
是否为垃圾邮件
是否患病
金融诈骗
虚假账号

看到上面的例子，我们可以发现其中的特点，那就是都属于两个类别之间的判断。逻辑回归就是解决二分类问题的利器。

三、逻辑回归的原理

2.1 输入

在这里插入图片描述
逻辑回归的输入就是一个线性回归的结果。

2.2 激活函数

sigmoid函数
分析
回归的结果输入到sigmoid函数当中
输出结果：[0, 1]区间中的一个概率值，默认为0.5为阈值

逻辑回归最终的分类是通过属于某个类别的概率值来判断是否属于某个类别，并且这个类别默认标记为1(正例),另外的一个类别会标记为0(反例)。（方便损失计算）

输出结果解释(重要)：假设有两个类别A，B，并且假设我们的概率值为属于A(1)这个类别的概率值。现在有一个样本的输入到逻辑回归输出结果0.6，那么这个概率值超过0.5，意味着我们训练或者预测的结果就是A(1)类别。那么反之，如果得出结果为0.3那么，训练或者预测结果就为B(0)类别。所以接下来我们回忆之前的线性回归预测结果我们用均方误差衡量，那如果对于逻辑回归，我们预测的结果不对该怎么去衡量这个损失呢？我们来看这样一张图

在这里插入图片描述
那么如何去衡量逻辑回归的预测结果与真实结果的差异呢？

2.3 损失以及优化

2.3.1 损失逻辑回归的损失，称之为对数似然损失，公式如下：

分开类别：
在这里插入图片描述
怎么理解单个的式子呢？这个要根据log的函数图像来理解

综合完整损失函数

接下来我们呢就带入上面那个例子来计算一遍，就能理解意义了。
在这里插入图片描述
我们已经知道，logP, P值越大，结果越小，所以我们可以对着这个损失的式子去分析

2.3.2 优化

同样使用梯度下降优化算法，去减少损失函数的值。这样去更新逻辑回归前面对应算法的权重参数，提升原本属于1类别的概率，降低原本是0类别的概率。

四、逻辑回归API

sklearn.linear_model.LogisticRegression(solver='liblinear', penalty=‘l2’, C = 1.0)

solver:优化求解方式（默认开源的liblinear库实现，内部使用了坐标轴下降法来迭代优化损失函数）
sag：根据数据集自动选择，随机平均梯度下降
penalty：正则化的种类
C：正则化力度

默认将类别数量少的当做正例

LogisticRegression方法相当于 SGDClassifir(loss=“log”, penalty="
"),SGDClassifier实现了一个普通的随机梯度下降学习，也支持平均随机梯度下降法（ASGD），可以通过设置average=True。而使用LogisticRegression(实现了SAG)

五、分类的评估方法

在很多分类场景当中我们不一定只关注预测的准确率！！！！！

5.1 精确率与召回率

5.1.1混淆矩阵

在分类任务下，预测结果(Predicted Condition)与正确标记(True Condition)之间存在四种不同的组合，构成混淆矩阵(适用于多分类)
在这里插入图片描述

5.1.2 精确率(Precision)与召回率(Recall)

精确率：预测结果为正例样本中真实为正例的比例（了解）
召回率：真实为正例的样本中预测结果为正例的比例（查的全，对正样本的区分能力）

那么怎么更好理解这个两个概念

还有其他的评估标准，F1-score，反映了模型的稳健型

5.1.3 分类评估报告API

sklearn.metrics.classification_report(y_true, y_pred, labels=[], target_names=None )

y_true：真实目标值
y_pred：估计器预测目标值
labels:指定类别对应的数字
target_names：目标类别名称
return：每个类别精确率与召回率

hyk今天写算法了吗

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

hyk今天写算法了吗 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。