首先我们回顾之前学习过的一些有关离散分类的问题:
邮件是否是垃圾文件
交易是否具有欺诈性
肿瘤是良性的还是恶性的
我们可以发现上述的例子的结果不是0就是1,如果将这样的训练集我们运用线性回归进行拟合和话,我们会发现结果会很糟糕或者说不符合实际。
甚至有一些的结果会大于1或者是小于0,这样我们更加不应该强制的将线性回归运用到其中。
所以这里我们提出Logistic回归,虽然它的名字中带有回归的字样,但是其实他属于分类算法。
Logistic回归算法的特点在于,它的输出值一直介于0-1之间。
Logistic回归算法的假设函数:
Logistic回归假设函数的输出说明:
将特征作为输入x,得到的结果y=1(恶性肿瘤)的概率为0.7,由于y只能等于0或1所以可以直接得出y=0的概率为0.3。