一、逻辑回归的地位
逻辑回归算法(logistics Regression)是机器学习领域最重要且最实用的算法。
是机器学习工程师面试的必备算法,需要对其细节进行仔细的把握。
在线上环境下,绝大多数分类问题都可以用逻辑回归算法解决。
逻辑回归在贷款违约情况预测、情感分析、广告点击率预测、疾病阴性阳性预测问题上有非常显著的效果。至少是建模的“基准”模型。
二、逻辑回归原理简述
逻辑回归是解决二分类问题的重要方法。
逻辑回归本身解决的是二分类问题,所以在这里我们就假定y的取值为0或者1。
当然逻辑回归也可以解决多分类问题,只是需要在每一个类别处建立一个逻辑回归分类器,判断是或不是该类别。
由于y的取值为0或者1, 只要我们能计算出p(y=1|x)和p(y=0|x)。
比如对于给定的一个样本x, 假如p(y=1|x) > p(y=0|x), 就可以把样本x分类成类别1了, 反之就类别0。
但是我们不能直接用p(y∣x)=w.T*x+b来作为条件概率的取值。因为等式右边的项其值域是无穷的,而左侧的概率只能是0到1之间进行取值。所以我们需要一个函数将右侧的无穷取值域压缩到0和1之间。——使用逻