00-02error从何而来

最新推荐文章于 2024-09-10 18:37:45 发布

loongqian

最新推荐文章于 2024-09-10 18:37:45 发布

阅读量158

点赞数

分类专栏：我的机器学习之路---0---李宏毅老师视频文章标签：机器学习李宏毅

本文链接：https://blog.csdn.net/loongqian/article/details/80282509

版权

4 篇文章 0 订阅

订阅专栏

1.bias和variance

上节说到，更复杂的model在testing data上不一定表现的更好，也就是可能会有更大的error。

那么error从何而来呢，有两个因素影响，一个是bias（偏差），一个是variance（方差）。

这里涉及到数学方面，讲述bias和variance

抽样的次数越多， bias和variance越接近真实值，所以每次在一个model中找出一个最好的function，再有很多很多model，把最好的function求期望，就会接近真实的function。

比较简单的model和复杂的model，发现简单的model受样本数据影响更小，有更小的variance，但有可能一开始就瞄错了靶心，即bias比较大。而复杂的model虽然variance更大，但很多复杂model的最好function求期望之后，却更为接近真实的function。如下图。

2.underfitting和overfitting

3.如何处理bias和variance

当model不能较好地fittraining data时，一般认为有比较大的bias（underfitting），这时候可以重新设计model，比如考虑更多feature，或者选择更复杂的model。

当variance比较大的时候，收集更多的数据是一个行之有效的方法，但这并不总是能办到的，另外一种方法就是Regularization。具体看接下来的学习吧。

关注

专栏目录