准备工作:(以预测宝可梦的CP值为例:下表表示component,上标表示完整object编号)![](https://img-blog.csdnimg.cn/c87f6c8747e247c396c4770fd04f12b4.png)
Step1:Model
Step2:Goodness of Function(函数的拟合优度)
scalar(标量)
(1)展示结果:
(2):获取Training Data:
(3)通过Training Data辨别一个function好坏
Loss function L(损失函数:衡量一组参数的好坏(本例中就是w和b的好坏)):是function的function,Input:a function ,output:how bad it is
Step 3:Gradient Descent (梯度下降)
η is called “learning rate“
1.一个参数:![](https://img-blog.csdnimg.cn/6bc6d4f96c4444249da24309330cc22e.png)
2.两个参数
注意:担心(出现局部最优)
但是在线性回归中无局部最优(重要)
我们还可以去寻找更好的Model(但是也有可能变得更糟糕)
更好:
在训练集更好但是在test上糟糕:
原因解释:(越复杂的model黑我们越好的traning data)
4.过拟合:越复杂的model不总是能让testing data更好的表现
所以要选择合适的model(本例就是选择第三种模型)![](https://img-blog.csdnimg.cn/7fed973516704635a56e1883309327da.png)
简化5.有可能存在其他因素的影响
本例而言可能是物种
(1)Back to step 1:Redesign the Model
简化:
结论: