文章目录
Datawhale第7期-《李宏毅机器学习》作业(二)
学习任务:
理解偏差和方差
由上一节的测试数据可知,当模型复杂度达到一定值时,复杂度继续增加并不会使测试集效果更好,反而使模型误差随着模型复杂度呈指数型增加,而这些error的主要来源是bias和variance。
误差为什么是由偏差和方差组成,推导相关公式
e r r o r = b i a s 2 + v a r i a n c e error = bias^2+variance error=bias2+variance,其中bias是指偏差,variance是指方差。推到如下:
采用均方误差衡量 e r r o r = E [ ( f ( x ) − y ) 2 ] = E ( f ( x ) 2 ) − 2 E ( f ( x ) ⋅ y ) + E ( y 2 ) = E 2 ( f ( x ) ) − 2 E ( f ( x ) ⋅ y ) + E ( y 2 ) + E ( f ( x ) 2 ) − 2 E 2 ( f ( x ) ) + E 2 ( f ( x ) ) = E 2 [ f ( x ) − y ] + E [ f ( x ) − E ( f ( x ) ) ] 2 = b i a s 2 + v a r i a n c e error=E[(f(x)-y)^2]=E(f(x)^2)-2E(f(x)\cdot y)+E(y^2)=E^2(f(x))-2E(f(x)\cdot y)+E(y^2)+E(f(x)^2)-2E^2(f(x))+E^2(f(x))=E^2[f(x)-y]+E[f(x)-E(f(x))]^2=bias^2+variance error=E[(f(x)−y)2]=E(f(x)2)−2E(f(x)⋅y)+E(y2)=E2(f(x))−2E(f(x)⋅y)+E(y2)+E(f(x)2)−2E2(f(x))+E2(f(x))=E2[f(x)−y]+E[f(x)−E(f(x))]2=bias2+variance,其中bias为 E [ f ( x ) − y ] E[f(x)-y] E[f(x)−y],而variance为 E [ f ( x ) − E