机器学习 之 SVM VC维度、样本数目与经验风险最小化的关系

经验风险最小化可能导致过拟合,为解决此问题引入置信范围,该范围与样本数n和VC维h相关。当n/h增大,置信范围减小,推广性增强。结构风险最小化兼顾分类精度和VC维,避免过学习。机器学习应寻求低VC维和适量样本数,以确保对未来样本的良好推广。
摘要由CSDN通过智能技术生成
        VC维在有限的训练样本情况下,当样本数 n 固定时,此时学习机器的 VC 维越高学习机器的复杂性越高。VC 维反映了函数集的学习能力,VC 维越大则学习机器越复杂(容量越大)。
        所谓的结构风险最小化就是在保证分类精度(经验风险)的同时,降低学习机器的 VC 维,可以使学习机器在整个样本集上的期望风险得到控制。

        经验风险和实际风险之间的关系,注意引入这个原因是什么?

        因为训练误差再小也就是在这个训练集合上,实际的推广能力不行就会引起过拟合问题。所以说要引入置信范围也就是经验误差和实际期望误差之间的关系

        期望误差R(ω) ≤ Remp (ω)+ Φ(n/h)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值