model error的来源包括两部分:bias和variance。
1、bias
uderfitting,模型太弱。
表现:在train data上都不能很好fit数据。
解决:重新设计model,可以加入更多的feature/增加模型的复杂度(如:使用feature的3次函数替代线性函数)
2、variance
overfitting,模型过于复杂,容易受数据影响。
表现:在train data上表现很好,在test data上error很大。
解决:more data; regularization(现在拟合函数都是比较平缓的,小系数)