x,y,m
举个栗子:房屋面积与房屋价格的关系表
房屋面积 | 房屋价格 |
---|---|
2104 | 460 |
1416 | 232 |
1534 | 315 |
852 | 178 |
... | ... |
输入“房屋面积”,得到输出“房屋价格”,则房屋面积被称为x(features),房屋价格被称为y
训练集数目为m
x(i)表示第i个x, y(i)表示第i个y
比如:x(1)=2014,y(2)=232
一组(x(i),y(i))被称为一个训练样本
h(x)
h(x)是对于y的对应值的一个“很好的”预测器,h指hypothesis
比如:
假设h(x)=θ0+θ1*x,我们的目标是根据训练集,使h(x)->y,h(x)尽可能地接近y
θ(i)为参数(Parameters),比如θ0和θ1
cost function(成本函数)
目标是找到合适的θ0和θ1,使成本函数趋近于0 -> h(x)趋近于y
找到J(θ0,θ1)的最优解,从图形上来说,一次方程有全局最优解,如图所示
由θ0,θ1共同决定J(θ0,θ1)的结果
把它变成平面图则是这样,横坐标是θ0,纵坐标是θ1,同一个圆圈的J(θ0,θ1)值一样,越往圆圈中心(最小的圆圈的中心)走,J(θ0,θ1)越小
最终得到最优解
视频资料:
https://www.bilibili.com/video/av9912938/