Logistic 回归模型是目前广泛使用的学习算法之一,通常用来解决二分类问题,虽然名字中有“回归”,但它是一个分类算法。有些文献中译为“逻辑回归”,但中文“逻辑”与 logistic 和 logit 的含义相去甚远,因此下文中直接使用 logistic 表示。Logistic 回归的优点是计算代价不高,容易理解和实现;缺点是容易欠拟合,分类精度可能不高。
以肿瘤分类为例,我们要预测肿瘤是否为恶性肿瘤,我们用 0 和 1 表示这两个取值,用 0 表示不是恶性肿瘤,用 1 表示是恶性肿瘤(当然也可以反过来,没有影响),那么数据集如图所示。
假如用线性回归模型来拟合的话,看起来可能会是这样的。
我们可以设置阈值为 0.5,如果输出小于等于 0.5