宽带离网用户分析(6) 不平衡学习

宽带离网用户分析之不平衡学习

  机器学习里面有个问题叫做Imbalanced-Learning(不平衡学习),其含义就是不同Label的样本数量差别很大。其实宽带离网用户分析就是一个典型的不平衡学习问题:就拿本实验的徐州宽带用户来说,总用户量为70万,而每个月的离网用户只有不到5000用户,这里正负例样本的比例是140:1,可见是很不平衡。
  这里说句老实话,工作的突破点并不是对不平衡学习的处理,工作的突破点其实还是找到了好的特征,使最终宽带离网用户预测的准确率达到了45%,而停机用户(用户状态处在不活跃状态)预测准确达到了87%。但是不平衡学习的确也是前期工作的一个重点,所以这里还是要赘述一下。

为什么不平衡学习很重要

实际离网用户 实际非离网用户
预测为离网用户 true positive(tp) false positive(fp)
预测为非离网用户 false negative(fn) true negative(tn)

  还记得我们在(1)里面讲的Precision和Recall吗,其实一个最常用的标准叫做预测准确率,也就是 (tp

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值