准备工作:(以预测宝可梦的CP值为例:下表表示component,上标表示完整object编号)![](https://i-blog.csdnimg.cn/blog_migrate/514d1db096ce9d4adf7cc56575555c0f.png)
Step1:Model
Step2:Goodness of Function(函数的拟合优度)
scalar(标量)
(1)展示结果:
(2):获取Training Data:
(3)通过Training Data辨别一个function好坏
Loss function L(损失函数:衡量一组参数的好坏(本例中就是w和b的好坏)):是function的function,Input:a function ,output:how bad it is
Step 3:Gradient Descent (梯度下降)
η is called “learning rate“
1.一个参数:![](https://i-blog.csdnimg.cn/blog_migrate/25f692239caacef2df956b685bf51e56.png)
2.两个参数
注意:担心(出现局部最优)
但是在线性回归中无局部最优(重要)
我们还可以去寻找更好的Model(但是也有可能变得更糟糕)
更好:
在训练集更好但是在test上糟糕:
原因解释:(越复杂的model黑我们越好的traning data)
4.过拟合:越复杂的model不总是能让testing data更好的表现
所以要选择合适的model(本例就是选择第三种模型)![](https://i-blog.csdnimg.cn/blog_migrate/55ce4ea09d9018059efe3f5f8f4ac9d3.png)
简化5.有可能存在其他因素的影响
本例而言可能是物种
(1)Back to step 1:Redesign the Model
简化:
结论: