样本均衡

解决样本不均衡问题:

1. 上采样:增加原来样本数量较少的样本,直接复制原来的样本----样本较少

2. 下采样:较少原来样本数量较多的样本,丢弃多于的样本----------样本较多

                  每次正样本数量不变,随机选择等量的不同负样本进行模型训练,反复几次,训练多个模型,投票决定最终的分类

3. 合成样本:增加原来样本数量较少的样本。----------------------------样本较少

                      从各个feature随机选择一个已有值,然后拼接成一个新样本

4. 改变样本权重:增大样本数量类别少类别的权重

                             当这样的样本被误分,损失值要乘以权重。

转载于:https://www.cnblogs.com/hapyygril/p/10024711.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值