线性分类器中的不均衡问题

线性分类器中的不均衡问题

目标:尽可能找出红色点

数据是可分的时候

数据比例是1:9
1:9的数据

我们先采用相等的权重,得到的分类平面为:
这里写图片描述

调整权重:
这里写图片描述

向上采样(这里的向上采样是直接复制少数样本)得到的分类平面和直接调整权重是一样的:
这里写图片描述

向下采样:
这里写图片描述

不可分数据:
这里写图片描述

如果已经是不可分的了,此时还需要使用线性分类器,那就需要自己再结合应用找新的特征,使得样本的映射到线性可分的空间;

一点小结论:
如果可以,但是我想说好的原因有以下两点:
1:数据量减少了,比较适合调整参数,容易进行模型调优;
2:应用中,不平衡数据中数据的相似度本身就高,通过采样,还是能够保留整体的一个数据特性,当然,也需要控制一下比例,没有必要达到平衡,也不建议达到平衡。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值