在模型中:
当模型复杂度过低时,偏差则会比较大,训练出来的模型会欠拟合,因而需要提高模型复杂度来降低模型偏差;
当模型复杂度过高时,方差则会较大,训练的模型会过拟合,因而需要降低模型复杂度来降低偏差。
因此,模型复杂度的选择是一个十分纠结的问题,该问题被称为“方差-偏差困境”。(如下图所示)
形象地理解可以举个这么例子:
考试前刷题,如果刷得太多了,考试时做题会很死板,思维被局限了;但如果刷的太少了,你在考试时会因为没能了解足够多的题型而失利。如何权衡好刷题数目就是个学问。
在模型中:
当模型复杂度过低时,偏差则会比较大,训练出来的模型会欠拟合,因而需要提高模型复杂度来降低模型偏差;
当模型复杂度过高时,方差则会较大,训练的模型会过拟合,因而需要降低模型复杂度来降低偏差。
因此,模型复杂度的选择是一个十分纠结的问题,该问题被称为“方差-偏差困境”。(如下图所示)
形象地理解可以举个这么例子:
考试前刷题,如果刷得太多了,考试时做题会很死板,思维被局限了;但如果刷的太少了,你在考试时会因为没能了解足够多的题型而失利。如何权衡好刷题数目就是个学问。