过拟合:当学习器将训练样本学习的“太好”了的时候,就极有可能已经把训练样本自身的一些特点当作了所有潜在样本都具有的一般性质,这样就会导致模型的泛化性能下降,这种现象被称为过拟合。
欠拟合:与之相对的就是欠拟合,这是指训练样本的一般性质并没有学习好!
有多种因素可能导致过拟合,其中最常见的情况是由于学习能力过于强大,以至于把训练样本所包含的不太一般化的特性也学习到了,而欠拟合通常是由学习能力低下导致的,欠拟合容易被客服,例如在决策树学习中扩展分支、在神经网络中增加训练轮数等。而过拟合是无法彻底避免的,我们能做的就只是缓解或者说减小其风险。