机器学习算法（一）（基于逻辑回归的分类）

最新推荐文章于 2022-02-23 21:04:55 发布

hezzfew

最新推荐文章于 2022-02-23 21:04:55 发布

阅读量304

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/hezzfew/article/details/107935809

版权

机器学习专栏收录该内容

21 篇文章 0 订阅

订阅专栏

机器学习算法（一）（基于逻辑回归的分类）

逻辑回归的介绍

逻辑回归（Logistic regression，简称LR），虽然是带有回归两个字，但逻辑回归其实是一个分类模型，并且广泛应用于各个领域之中。虽然现在深度学习相对于这些传统方法更为火热，但实则这些传统方法仍然有其独特的优势依然广泛应用于各个领域中。
逻辑回归最突出的两点就是模型简单和模型的可解释性强。
优点：实现简单，易于理解和实现；计算代价不高，速度很快，存储资源低。
缺点：容易欠拟合，分类精度可能不高。
逻辑回归和线性回归的区别，就是广泛的线性回归，只是线性回归对应的是拟合直线的能力，而逻辑回归则将对应的值域通过sigmoid函数映射到[0,1]，变成了一个概率，通过确定分类边界来确定类别，因此由回归模型过渡到分类模型。

逻辑回归的应用

逻辑回归模型广泛应用于各个领域，包括机器学习，大多数医学领域和社会科学。例如，最初由Boyd等人开发的创伤和损伤严重度评分（TRISS）被广泛用于预测受伤患者的死亡率，使用逻辑回归基于观察到的患者特征（年龄，性别，体重指数，各种血液检查的结果等）分析预测发生特定疾病（例如糖尿病、冠心病）的风险。逻辑回归模型也用于预测在给定的过程中，系统或产品的故障的可能性。还用于市场营销应用程序，例如预测客户购买产品或中止订购的倾向等。在经济学中它可以用来预测一个人选择进入劳动力市场的可能性，而商业应用则可以用来预测房主拖欠抵押贷款的可能性，条件随机字段是逻辑回归到顺序数据的扩展，用于自然语言处理。

逻辑回归模型现在同样是很多分类算法的基础组件，比如分类任务中基于GBDT算法+LR逻辑回归实现的信用卡交易反欺诈，CTR（点击通过率）预估等，其好处在于输出值自然地落在0-1之间，并且有概率意义。模型清晰，有对应的概率学理论基础，它拟合出来的参数就代表了每一个特征（feature）对结果的影响，也是一个理解数据的好工具。但同时由于其本质上是一个线性的分类器，所以不能应对较为复杂的数据情况。很多时候我们也会拿逻辑回归模型去做一些任务尝试的基线（基础水平）。

逻辑回归的原理

当z≥0 时,y≥0.5,分类为1，当 z<0时,y<0.5,分类为0，其对应的y值我们可以视为类别1的概率预测值。Logistic回归虽然名字里带“回归”，但是它实际上是一种分类方法，主要用于两分类问题（即输出只有两种，分别代表两个类别），所以利用了Logistic函数（或称为Sigmoid函数），函数形式为：
在这里插入图片描述
通过上图我们可以发现 Logistic 函数是单调递增函数，并且在z=0
而回归的基本方程，
将回归方程写入其中为：

所以，