一、 关于回归
在分类中问题中,如果给定一个输入,其所产生的输出是一个布尔值,那么这是是与否型的答案;而在输出是数值型的值下,我们所希望的学习结果不是C={0, 1},而是一个连续的函数。我们倾向于将数值的输出写成关于输入的函数,数值输入称为自变量,数值输出称为因变量。我们希望通过对训练数据集学习后得出一个类似下面的函数关系式(这里以简单线性为例)。
在二元分类中,我们需要一个这样的函数:它能够接收所有的输入并能预测类别,即0或1。Sigmoid函数正是我们需要的函数,
sigmoid函数它具有以下性质:
a、函数输入为0时,Sigmoid结果为0.5。
b、随着输入x值的增大,Sigmoid函数接近1,随着x的减小,其值接近于0。
我们将上面拟合得到函数g(x)代入Sigmoid函数中,若g(x)输出值大于0时,Sigmoid函数结果大于0.5,g(x)值小于0时,Sigmoid函数小于0.5。这样Sigmoid函数把g(x)函数值转为为后验概率,也即Sigmoid函数大于0.5概率时,我们将X类标标记为1,而概率小于0.5时,X类标记