偏差bias、方差 variance

最新推荐文章于 2023-06-19 10:05:54 发布

冰鋒

最新推荐文章于 2023-06-19 10:05:54 发布

阅读量471

点赞数

分类专栏：机器学习文章标签：机器学习

机器学习专栏收录该内容

15 篇文章 3 订阅

订阅专栏

回顾
- 降低泛化误差

机器学习算法中，我们主要目的是同时降低模型的偏差和方差；然而，真实情况是我们不能同时做到，只能折中。

回顾

误差来源：
bias：测试集中的很多点并没有表达出来，bias很大；
variance：选用的测试集数据与真实的数据分布不一致，导致variance大；

偏差：
描述了数据的表达能力，图一显示，弱分类器的表达能力弱，造成偏差较大，即欠拟合；增加模型的复杂度，增加数据特征等；

方差：描述了 泛化能力，图二显示了，强分类器的泛化能力弱，方差过大；即过拟合，降低模型复杂度，增加数据量等；

降低泛化误差

多个随机变量的均值比单一值的方差小；
有两种思路：bagging, boosting;

Bagging

重采样的方式，获得多个多个随机变量，然后求均值，可以获得更小的方差；
这是一种重采样方式，虽然不能使得期望=均值，但是可以弥补损失；
本质上：通过重采样，增加了对训练数据的扰动，降低方差；
例子：随机森林模型，是集成学习方法，多个独立的模型一起作用，求得最终的结果，每一个模型都是强分类器（variance较大），集成后可以降低方差；
另一方面，集成之后，增加了决策的能力，使得数据的表达能力增大了，这也就反过来降低了偏差；

Boosting

提升学习方法，多个弱分类器构成，每一个分类器的bias很大；通过不断的模型提升（复杂化），模型的表达能力增大，降低了bias误差；
另一方面，提升模型中，会增加误分类样本的权重，即对训练数据进行扰动，也减小了variance误差；

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

冰鋒 CSDN认证博客专家 CSDN认证企业博客

码龄12年

15: 原创

13万+: 周排名

68万+: 总排名

12万+: 访问

: 等级

1010: 积分

85: 粉丝

122: 获赞

29: 评论

500: 收藏

私信

关注

热门文章

分类专栏

机器学习 15篇
test
推荐系统 7篇
熵 1篇

最新评论

两个高斯分布乘积的推导及解释，BPMF 公式推导
橱柜_vision: 二阶导数确实说的不对
两个高斯分布乘积的推导及解释，BPMF 公式推导
545613412: 可以
推荐系统总结MF->PMF->CTR->CDL->CNN
靳晓帅回复不想当筛子: 额，上一个回复感觉不太准确，这个X0之所以没有包含进去因为它是Xc的一个加噪后的数据，它的“第位”和Xc相同，AE的输入是不加噪的，而DAE之所以要加噪是因为想提高抗噪能力，所以说就DAE或SDAE这部分来说，最终的损失函数应该要体现出输出端（即XL)和真实的输入（即Xc）的差异，而不是X0。其实这么一描述的话，SDAE这部分的输入其实是Xc，而X0是它之后的一层，从这个角度来看它又可以包含进来了，那么体现在目标函数就是有λs的那一项，但是λs趋于无穷的原因，这一项最终忽略了。
推荐系统总结MF->PMF->CTR->CDL->CNN
靳晓帅回复不想当筛子: 时间有点久了，我有些生疏。我理解是输入是固定的，既然是概率模型，那固定的输入就是1，所以没必要包含了吧（不知道说的对不对，有空的话我再看看）
两个高斯分布乘积的推导及解释，BPMF 公式推导
不想当筛子: 不错，写得很通俗

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。