样本不均衡

1. 设置不同的惩罚参数  【著名例子:生病 健康问题】

2. smote方法 增加少数类样本的数量【程序:smote算法的程序;与SVM相结合的程序】;

    现数据集分层抽样;

    AdaCost非均衡数据集分类

————————

A:样本中的1的准确预测比0更重要(或相反) => 数据不对称定义的一个关键点

      代价敏感学习(可行).    评价结果用ROC曲线

B:0,1 同等重要:同时考虑召回率 / 结合准确率与召回率的耦合的指标

C:emsemble learning(随机森林,adaboost等)防过拟合  (在train之前做 数据clean,train时用Random Forest Boosting)

       oversample(过大: overfiting)  /  undersample(过小: underfitting)

————————

1. ROC曲线:

http://baike.baidu.com/link?url=QTcWmR9tY_srWKNHdBBQXE0iPA885mwA2IjlX7TxruMNG06sVuyog9wqmN-1xFcIKz650QfarjMamwk8AAxSWq


https://www.douban.com/note/284051363/


2. Matlab利用Libsvm-mat画ROC曲线

http://www.ilovematlab.cn/thread-63881-1-1.html

3. ROC和AUC

https://www.douban.com/note/284051363/

4.svm_learn训练样本不均衡

http://www.newsmth.net/nForum/#!article/AI/1463

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值