五、Logistic回归
1.核心:Logistic回归算法
(1)用于监督学习里的分类问题,预测离散型输
出,是一种分类算法.
(2)分类问题
二分类:输出为0(负类)或者1(正类)
多分类:输出为0,1,2,3等等
2.logistic回归的假设函数h(x)
对于分类问题,如果直接用线性回归中的假
设函数h(x)=θ^T*X,通过拟合发现不适用于分类问
题。因此需要对假设函数进行修改。
因为分类问题输出只有1和0,所以要控制h(x)的值
在[0,1]之间:
引入logistic函数——g(z)=1/(1+e^-z)
将两个函数合为最终的假设函数:
h(x)=g(θ^T*X)
此时的h(x)的意义相当于 P{y=1(0)|x;θ}
那到底是取1还是取0?
取决于阈值,在分类问题中一般令其为0.5(大于
0.5取1,小于取0),相当于通过比较h(x)和0.5判断
取值。
通过对g(z)函数图像的研究,我们发现当z=0
时,g(z)=0.5。所以可以通过
z=θ^T*X>0 得到h(x)>0.5;
z=θ^T*X<0 得到h(x)<0.5;
其中当θ^T*X=0时的拟合曲线是一条决策边界。
3.logistic回归的代价函数
代价函数