1. 二元分类
1.1 logistic模型
首先,我们需要搞清楚二元分类模型与之前的线性回归模型的区别。之前的线性回归模型是预测连续输出,对应的典型问题就是预测房价。而现在的二元分类问题是预测一个离散的输出,只关心有无,对应的典型问题就是预测有无癌症。二元分类问题只需要选取一个阈值,超过这个阈值就是 y=1 y = 1 ,低于这个阈值就是 y=0 y = 0 。并且预测分析的输出最好是在 [0,1] [ 0 , 1 ] 这个范围之内的,因为毕竟训练数据集中的输出也只有 0 0 和
。
根据上面分析,二元分类问题对于 hθ⃗ (x⃗ ) h θ → ( x → ) 有一个要求:
hθ⃗ (x⃗ )∈[0,1] h θ → ( x → ) ∈ [ 0 , 1 ]
而logistic函数就有这样优秀的性质。我们令
h