SVM训练时候样本不均衡怎么设置惩罚项

  • 问题:
    在做气泡检测项目时候,利用svm对训练集进行训练的时候,我的数据集存在这严重的不均衡现象,具体情况如下:
训练集数据情况:
正样本(有气泡):150    标签:+1
负样本(无气泡):800    标签:-1
负样本/正样本=800/150=5.3
测试集数据情况:
正样本(有气泡):53     标签:+1
负样本(无气泡):100    标签:-1

显然正负样本很不均衡,针对这种情况的解决方案就是设定惩罚项的权重,也就是调节svmtrain()函数的参数-wi,在这个项目中,因为负样本/正样本=800/150=5.3也就是说label(-1)/label(+1)=5.3,所以为了平衡这种样本数量的不均衡,设定惩罚项C的权重如下:
样本不均衡描述:label(-1)/label(+1)=5.3
权重设置描述:-w1=5, -w-1=1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值