分类
根据现有数据对分类边界线建立回归公式,以此进行分类。
1. 回归,即最佳拟合,表示要找到最佳拟合参数集;
2. 寻找最佳拟合参数,使用的是最优化算法。
找到一个函数,能接受所有的输入然后预测出类别。比如,当有两个类的情况下,上述函数输出0或1。
Sigmoid
函数
σ(z)=11+e−z
此处应有 Sigmoid 函数的图像
容易知道函数的值域为 (0,1) ,且当 z=0 时, σ(0)=0.5 。
为了实现
Logistic
回归分类器,我们可以在每个特征上都乘以一个回归系数,然后把所有的结果值相加,将这个总和代入
Sigmoid
函数中,进而得到一个范围在
(0,1)
之间的数值。任何大于
0.5
的数据被分入
1
类,小于
那么现在的问题就是:最佳回归系数是什么?如何确定它们的大小?