逻辑回归定义
逻辑回归(Logistic Regression)是一种用于解决二分类(0 or 1)问题的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,垃圾邮件的分类等等,以及某广告被用户点击的可能性等。但这里的可能性与数学上的概率不一样。
问题引入
对于肿瘤是恶性还是良性的分类,我们得出一下模型
从上图可以看到,在现在的情况下,当 h θ ( x ) > = 0.5 h_\theta(x) >= 0.5 hθ(x)>=0.5的时候,我们认为肿瘤是恶性的,这里我们会得到完全一样的结果,正确率达到100%。但是当我们的数据变成下图这样的时候
我们仍然认为0.5是一个阈值,那么此时模型对结果的预测的性能将会表现得很差。说明我们不能用简单的直线对数据进行分类。
逻辑回归
分类问题我们可以将其转化为数值的计算问题,我们根据计算得到的数值对数据进行分类,我们要求
0 < = h θ ( x ) < = 1 0 <= h_\theta(x) <= 1 0<=hθ(x)<=1
从而我们认为当 0 < = h θ ( x ) < 0.5 0 <= h_\theta(x) < 0.5 0<=hθ(x)<0.5的时候, y = 0 y = 0 y=0;当 0.5 < = h θ ( x ) < = 1 0.5 <= h_\theta(x) <= 1