一、LR产生背景
先看下面两张网上借鉴的图1和图2。X轴表示肿瘤大小,Y轴>0.5表示是癌症,否则不是。紫色直线表示预测直线,从图中可以看出,X对应到预测直线上的值之后,上面4点是癌症,下面4点不是癌症。再转到图2,点的排列一旦变化,0.5的阈值很可能就不适用,这主要是在线性拟合中,Y的值无限延伸造成的。
为了解决Y值无限延伸的问题,LR算法应运而生,把Y的值限定在0和1之间,完美解决Y值无限延伸的问题。嚓!LR那么牛逼,上LR依据公式(1)sigmoid函数,sigmoid函数简直就是逻辑回归的救世主,上逻辑函数图3。从图3可以看到,随着X往正负值无限延伸,Y的值被限定在0和1,判决值可以根据需要设定为0.5,无压力。
(1)
这么牛逼的公式,它对应的图如图3所示。
图1 线性可分阈值0.5
图2 线性不可分阈值0.5