方差 Variance , 描述数据分布的离散程度,方差越大,数据越分散。(训练算法不稳定呗 dev set error 与training set error相差大 ,training set 欠拟合 )
偏差 Bias, 描述数据的预测值与真实值之间的差距,偏差越大,预测数据离真实值差距越大。(test set error 与 dev set error相差大, 对dev set 过拟合)
以上关于variance和bias的判断是基于train和dev、test是同分布的时候。
在做训练时,有时training set 是一种分布, dev/test是一种分布。这时training error 1% dev error 10% 并不一定是Variance很大。因为train set 和 dev set是不同分布的。解决:
在training set 中分割出一部分作为train-dev set
这时training error较大, human error 较小,则是avoidable bias ,模型还需要训练。
training error 小,train-dev error 大, 说明时Variance问题
training error 小,train-dev error 也小 , dev error较大,则是由于训练与开发数据分布不同,data mismatch导致
training error 小, train-dev error 也小, dev error 也小,test error较大,则是bias 问题