过拟合 过拟合指模型可以很好的拟合训练数据,但对于测试数据不会有很好的拟合效果。过拟合通常是由模型阶数过高(有太多的特征值)引起的。 解决过拟合的办法通常为以下三种: 1.收集更多的训练数据 2.如果特征过多,但训练数据不足也会导致过拟合,所以可以通过选择合适的特征子集来解决。 3.通过正则化的方法,正则化指保留所有的特征但减小特征系数w,使特征对于整体函数的影响变小。正则化在避免算法过拟合中应用广泛。