逻辑回归
1 二元逻辑回归
1 二元逻辑回归
回归是一种很容易理解的模型,就相当于y=f(x),表明自变量x与因变量y的关系。最常见问题如医生治病时的望、闻、问、切,之后判定病人是否生病或生了什么病, 其中的望、闻、问、切就是获取的自变量x,即特征数据,判断是否生病就相当于获取因变量y,即预测分类。最简单的回归是线性回归,但是线性回归的鲁棒性很差。
逻辑回归是一种减小预测范围,将预测值限定为[0,1]间的一种回归模型,其回归方程与回归曲线如下图所示。逻辑曲线在z=0时,十分敏感,在z>>0或z<<0时,都不敏感。
逻辑回归其实是在线性回归的基础上,套用了一个逻辑函数。上图的g(z)就是这个逻辑函数(或称为Sigmoid函数)。下面左图是一个线性的决策边界,右图是非线性的决策边界。
对于线性边界的情况,边界形式可以归纳为如下公式(1):
因此我们可以构造预测函数为如下公式(2):
该预测函数表示分类结果为1时的概率。因此对于输入点x
,分类结果为类别1和类别0的概率分别为如下公式(3):
2 多元逻辑回归
二元逻辑回归可以一般化为多元逻辑回归用来训练和预测多分类问题。对于多分类问题,算法将会训练出一个多元逻辑回归模型, 它包含K-1个二元回归模型。给定一个数据点,K-1个模型都会运行,概率最大的类别将会被选为预测类别。
对于输入点x,分类结果为各类别的概率分别为如下公式(6),其中k表示类别个数。
对于k类的多分类问题,模型的权重w = (w_1, w_2, ..., w_{K-1})是一个矩阵,如果添加截距,矩阵的维度为(K-1) * (N+1),否则为(K-1) * N。单个样本的目标函数的损失函数可以写成如下公式(7)的形式。
对损失函数求一阶导数,我们可以得到下面的公式(8):
根据上面的公式,如果某些margin的值大于709.78,multiplier以及逻辑函数的计算会出现算术溢出(arithmetic overflow)的情况。这个问题发生在有离群点远离超平面的情况下。 幸运的是,当max(margins) = maxMargin > 0时,损失函数可以重写为如下公式(9)的形式:
同理,multiplier也可以重写为如下公式(10)的形式。
3 逻辑回归的优缺点
- 优点:计算代价低,速度快,容易理解和实现。
- 缺点:容易欠拟合,分类和回归的精度不高。
4 实例
下面的例子展示了如何使用逻辑回归: