1. 线性回归存在的问题
(为什么举这个例子?逻辑回归为什么Y是0,1分类。。。哎,咱也不知道,咱也不敢问)假设肿瘤的良(0)恶(1)性与肿瘤尺寸大小(tumor size)有如下关系:
某一尺寸大小的肿瘤均划分成了良性、恶性,其划分Malignant可能等于0.5。但是当加入一个尺寸很大的样本时:
为了拟合所有数据,回归线将发生变化,如果Malignant仍然等于0.5,那么将会出现一部分先前划分为恶性肿瘤的样本被划分成良性(因为尺寸大小小于Malignant=0.5对应的tumor size),所以我们就只能将Malignant的值进行调整
2. Logistic Regression基本模型
逻辑回归公式:
引入Sigmoid函数使曲线