样本不均衡

最新推荐文章于 2023-07-28 14:01:42 发布

ttxzszxy

最新推荐文章于 2023-07-28 14:01:42 发布

阅读量1.3k

点赞数

分类专栏： HIT_bs

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ttxzszxy/article/details/51482637

版权

HIT_bs 专栏收录该内容

20 篇文章 1 订阅

订阅专栏

1. 设置不同的惩罚参数【著名例子：生病健康问题】

2. smote方法增加少数类样本的数量【程序：smote算法的程序；与SVM相结合的程序】；

现数据集分层抽样；

AdaCost非均衡数据集分类

————————

A：样本中的1的准确预测比0更重要（或相反） => 数据不对称定义的一个关键点

代价敏感学习（可行）. 评价结果用ROC曲线

B：0,1 同等重要：同时考虑召回率 / 结合准确率与召回率的耦合的指标

C：emsemble learning（随机森林，adaboost等）防过拟合（在train之前做数据clean，train时用Random Forest Boosting）

oversample(过大: overfiting) / undersample(过小: underfitting)

————————

1. ROC曲线：

http://baike.baidu.com/link?url=QTcWmR9tY_srWKNHdBBQXE0iPA885mwA2IjlX7TxruMNG06sVuyog9wqmN-1xFcIKz650QfarjMamwk8AAxSWq

https://www.douban.com/note/284051363/

2. Matlab利用Libsvm-mat画ROC曲线

http://www.ilovematlab.cn/thread-63881-1-1.html

3. ROC和AUC

https://www.douban.com/note/284051363/

4.svm_learn训练样本不均衡

http://www.newsmth.net/nForum/#!article/AI/1463

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
样本不均衡

1. 设置不同的惩罚参数【著名例子：生病健康问题】2. smote方法增加少数类样本的数量【程序：smote算法的程序；与SVM相结合的程序】；现数据集分层抽样； AdaCost非均衡数据集分类————————A：样本中的1的准确预测比0更重要（或相反） => 数据不对称定义的一个关键点代价敏感学习（可行）. 评价结果用ROC曲线
复制链接

扫一扫

专栏目录

ttxzszxy CSDN认证博客专家 CSDN认证企业博客

码龄9年

33: 原创

104万+: 周排名

111万+: 总排名

11万+: 访问

: 等级

1155: 积分

12: 粉丝

19: 获赞

7: 评论

92: 收藏

私信

关注

热门文章

分类专栏

matlab2014 8篇
matlab命令 4篇
dp特征 1篇
cell 1篇
D-S 1篇
机器学习 3篇
基本概念 2篇
excel 1篇
宏操作 1篇
毕设
HIT_bs 20篇
工作 1篇
产品 1篇
HTML 1篇

最新评论

类内距离&类间距离
克列玛: 输入什么样的矩阵啊
类内距离&类间距离
weixin_44435353: 我也想问，可以用Sw、Sb吗
类内距离&类间距离
qq_39958146 回复于金莹: 请问你弄懂了，标准格式应该怎么设置
类内距离&类间距离
于金莹: %y --一个N维行向量，第i个元素包含X中第i个向量的label（总共有c个类标）请问y值是什么意思呢？
类内距离&类间距离
ZDY951103: 算出来的这个Sw、Sb是自己可以作为调用画ROC曲线函数的参数吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。