线性模型
任务:找出一条线能够对数据进行划分或预测趋势
关键:找到合适的w和b
更适合于连续性的数值,如果数据是离散的如色泽是青绿色,我们需要对特征值进行编码
首先我们考虑是否是有序的
若有序,如身高的高中低,我们可以编为1,0.5,0
若无序,如一共有三种色泽,某种色泽是青绿色,我们可以标为[0 1 0]
如何找到合适的 w和b?
均方误差最小化,利用最小二乘法找到一组合适的w和b使得均方误差最小
偏导为什么可以?
在我们求最佳参数的过程中,参数在不断变化,我们对其进行偏导,并让其等于0,这时候参数不再变化,他可能是极大值,也可能是极小值。而均方误差最大值是无穷大,因此极大值是不存在的,求得的结果只可能是在极小值上,因此我们求出的结果,即是均方误差最小的时候,就是我们想要的最佳参数
推广
根据具体情况可能有以下两种结果:
若此时根据归纳偏好,或者引入正则化,选出最佳的参数