VC维和bias-variance

VC维作为评估模型复杂度的重要指标,表示在N维空间下最大能被打散的样本数量,高VC维意味着更高复杂度和更强分类能力。Bias-Variance分解则将期望误差分为bias、variance和噪音三部分,bias衡量逼近目标的能力,variance表示训练集变化引起的估计结果差异。低偏差和低方差的理想情况是模型准确且稳定。
摘要由CSDN通过智能技术生成

VC维和bias-variance


VC维

很多时候,假设空间的取值是无限的,我们无法用取值来衡量模型的复杂度。于是采用VC维来评判模型复杂程度,反映模型的学习能力,VC维越大,模型的复杂度越高,容量越大,分类能力越强。

如何衡量一类模型的分类能力?
用假设集合里的任意最好的模型去衡量此数据维度下的最复杂的情况。对于N维空间下的n个样本的数据集,存在一种超平面(二维空间就是一条直线)将这个数据集样本二分类,那么在N维空间下这n个样本就可以被打散,反之不能够被打散。
对于N维空间,VC维就是最大的满足可打散的样本数量。
以二维空间举例,如果数据量为3,样本不论如何分布,总有一条直线将其划分开。可以说线性模型的VC维=N-1。
对于样本数量为4的时候,一条直线很多时候不能完全将样本二分类

bias-variance

给定学习目标和训练规模,bias-variance可以把一种学习算法的期望误差分解为三个非负项的和,bias、variance和噪音。
噪音是数据本身存在的,无论用什么模型和方法都

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值