训练数据过度拟合:
当模型相对于训练数据的数量和噪声都过于复杂时,会发生过度拟合。
解决方案如下:
1)简化模型;可以选择较少参数的模型,可以减少训练数据中的属性数量,或者是约束模型。
2)收集更多的训练数据。
3)减少训练数据中的噪声。(例如:修复数据错误和消除异常值)
训练数据拟合不足:
对于下层数据结构来说,模型太过简单。比如,用线性模型来描述生活中的信服指数,很明显,这里边的现实情况远比模型复杂得多。
解决方案如下
1)选择一个带有更多参数,更强大的模型。
2)给学习算法提供更好的特征集。
3)减少模型中的约束(比如,减少正则化超参数)
注意:通过约束模型使其更简单,并降低过度拟合的风险,这个过程称为正则化
可以参考《机器学习实战-基于Scikit-Learn和TensorFlow》