因为第一,机器学习算法一般在超越了人的表现之后就难以再上升了。比如一张模糊的照片,判断是否猫,人和机器都何难判断。z
这个不可能再上升的情况叫做Bayes error.是理论上最好的结果了。一般机器学习算法接近人的表现的时候,就已经近这个最优的解了。
第二,当机器学习算法超过或者接近人的表现的时候,就很难在根据某些人工的工具去提升这个算法了。比如和人工标注的结果进行比较,使得找出问题,然后使算法更好。
如果人的误差是1%,train error是8%,dev error是10%那么注意力集中在偏差上。减少train error和人的误差之间的差值。
如果人的误差是7.5%,train error是8%,dev error 是10%那么注意力集中在方差上。减少train error和dev error之间的差值。
人的误差和train error之间的差值是可以减小的,叫做可避免偏差。