理解机器学习中的方差

最新推荐文章于 2022-07-14 17:39:46 发布

vincent2610

最新推荐文章于 2022-07-14 17:39:46 发布

阅读量1.2k

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/vincent2610/article/details/53735254

版权

一直没能理解机器学习中方差是什么概念，今天偶然碰见scikit官网的一段程序，让我有了一些深刻的理解。

我们假设要计算回归树在回归问题中的方差，那么方差可以这样描述：

1. 我们有一个训练集Train

2.将其均分成k个子集，Train1, Train2, ..., Traink

3.k个子集可以分别训练k个回归树,RT1, RT2, ..., RTk

4. 我们有一个测试集Test

5. 用k个回归树对这同一个测试集测试，那么可以生成k个测试结果集：Result1, Result2, ..., Resultk

6. k个测试结果集，排成一列，即：

Result1={y11, y12, y13, ...}

Result2={y21, y22, y23, ...}

……

Resultk={yk1, yk2, yk3, ...}

7. 上面排列可以看成矩阵M，M[:, 1]表示k个回归树对同一个输入x1的不同回归结果

8.对M[:, 1]求方差，那么就可以知道回归树的方差

9. 如果回归树是一个方差小的模型，那么M[:, 1]的方差应该会小，

也就代表回归树在给定同一个问题的不同的训练集情况下，都能输出相似的稳定的模型，而不是各异的过拟合的模型

参考：http://scikit-learn.org/stable/auto_examples/ensemble/plot_bias_variance.html#sphx-glr-auto-examples-ensemble-plot-bias-variance-py

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
理解机器学习中的方差

一直没能理解机器学习中方差是什么概念，今天偶然碰见scikit官网的一段程序，让我有了一些深刻的理解。我们假设要计算回归树在回归问题中的方差，那么方差可以这样描述：
复制链接

扫一扫

vincent2610 CSDN认证博客专家 CSDN认证企业博客

码龄15年

54: 原创

19万+: 周排名

151万+: 总排名

41万+: 访问

: 等级

3872: 积分

53: 粉丝

82: 获赞

44: 评论

216: 收藏

私信

关注

热门文章

分类专栏

自然语言处理 13篇
机器学习 29篇
C/C++ 11篇
Java 13篇
算法|数据结构 17篇
网络 5篇
操作系统 2篇
hadoop 3篇
数学 6篇
其他 12篇
GIS 2篇

最新评论

libcurl进行HTTP GET获取解析JSON数据
兽兽: read_json(ss, pt);这个函数可以发下吗
libcurl进行HTTP GET获取解析JSON数据
兽兽: 我看不懂，48行接收res数据这个55行out.str();是什么意思，
excel禁止(避免)输入重复数据的设置方法
snowwest: 单个工作表避免重复的设置，1.为啥我完全按照教程设置后，还是可以输入相同的值，并且没有报错？ 2.为啥单独查看某个已设置的单元格的“数据验证”设置，公式(F)竟然变成了=COUNTIF(C:C,C65531)=1？
excel禁止(避免)输入重复数据的设置方法
snowwest: 若需求是：多个工作表excel避免重复输入。那么公式应该是什么呢？
Mac下静态库和动态库的创建和使用
Linraffe: gcc -L./的时候可以，但是把库移动到其他目录，比如/usr/lib就不行了，设置LD_LIBRARY_PATH也不行，不知道为什么

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。