case:
建立一个线性模型:预测宝可梦进化后最大的cp战斗值
找一个函数f1或f2或f3等等,输入feature:x
loss function:衡量函数f的好坏==一组参数的好坏
loss=真实数值-预测数值的平方相加
找出最好的f,宝可梦数据集只有十个,可用线代,但是大量数据集的话,采用梯度下降梯度下降,找最小loss
找到归点值,当有两个参数w,b,求他俩的偏导数
找最优点,蓝色的loss最小,红色最大
线性回归函数没有局部最优解,不会出现这种情况,而是等高线图,从任意个点找最后都是等高线中间
算偏微分
更复杂model,稍微好一些
过拟合
收集更多的数据集(宝可梦)
隐藏的影响因素: 物种
回到第一步:不同物种,就代入不同的f
改写为线性f
是否还有别的影响因素?重量,高度,hp?
不知道的话,就全部加入到f中
预期得到很低的error,但是却得到很高。
可以去掉参数,但通常不知道去掉那些,所以使用正则化!
需要平滑的f,这样有不同的输入,变化是小的