1.之前在线型回归中通过假设函数预测的Y值可能远远小于0,或远远小于1,在分类算法模型中不合适。
这时通过logistic函数来使y值在0~1之间。
2.logistic函数输出的是在给定的参数x,假设函数h(θ)输出y=1的可能性
3.决策边界
由logistic函数可知 当θ的转置X>=0 h(θ)>=0.5 suppose y =1
画出 θ的转置X矩阵 >0 的范围就是决策边界
3.代价函数 是为了找出最适合的一组θ的计量
①当 y = 0时 代价函数只有后半部分
②当 y = 1时 代价函数只有前半部分
这里就不再详细阐述代价函数了
4.梯度下降 找出最适合的θ
通过多次同步的更新θ就可以得到最适合的假设函数了。
正则化
正则化是为了防止过度拟合 如图2
怎样来防止过度拟合呢?在J(θ)代价函数中加惩罚项 同时优化梯度下降函数
可以得出
这样就能得到一个很好的拟合的数据模型了