分类任务中的样本不均衡问题

最新推荐文章于 2024-03-23 09:57:14 发布

BUAA_小胡

最新推荐文章于 2024-03-23 09:57:14 发布

阅读量973

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010848594/article/details/108952643

版权

本文探讨了在行人属性识别工程中遇到的数据不均衡问题，通过使用类似imbalanced-dataset-sampler的方法，通过概率权重调整实现各类别样本的均衡生成，涉及over-sampling和under-sampling策略。

摘要由CSDN通过智能技术生成

参考：
https://github.com/ufoym/imbalanced-dataset-sampler

最近在做行人属性相关工程，遇到个样本不均衡问题。
问题描述：行人属性中很多属性不平衡，例如，戴帽子和不戴帽子的人的比例很悬殊，我们的训练集就会出现数据不均衡现象。
针对这种现象，我们采用一种数据均衡采样器解决，思路是这样的，每个线程以1/2概率从戴帽子和不戴帽子的图像队列中取出数据。这样即可保证带帽和不戴帽的数据生成相对均衡。

类似的，假如是多任务多属性的话，可以通过设置不同任务以及不同属性的概率权重达到产生均衡数据的数据生成器的作用。

总结：分类样本不均衡就是利用re-sample
要么：1.over-sampling，复制样本数较少的类别的样本
2.under-sampling，删除样本数量较多的类别的样本

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分类任务中的样本不均衡问题

参考：https://github.com/ufoym/imbalanced-dataset-sampler最近在做行人属性相关工程，遇到个样本不均衡问题。问题描述：行人属性中很多属性不平衡，例如，戴帽子和不戴帽子的人的比例很悬殊，我们的训练集就会出现数据不均衡现象。针对这种现象，我们采用一种数据均衡采样器解决，思路是这样的，每个线程以1/2概率从戴帽子和不戴帽子的图像队列中取出数据。这样即可保证带帽和不戴帽的数据生成相对均衡。类似的，假如是多任务多属性的话，可以通过设置不同任务以及不同属性的概率
复制链接

扫一扫

BUAA_小胡 CSDN认证博客专家 CSDN认证企业博客

码龄11年

84: 原创

8万+: 周排名

56万+: 总排名

8万+: 访问

: 等级

1294: 积分

11: 粉丝

40: 获赞

11: 评论

121: 收藏

私信

关注

热门文章

分类专栏

CUDA 2篇
刷题 13篇
C++ 4篇
numpy 1篇
C++面试 2篇
设计模式 1篇
opencv
Java
life
神经网络 5篇
日程
试验结果

最新评论

export用法
structrue: 想问问为哈我在终端执行export 会说export找不到
深度学习基础-ReLU和Sigmoid对比
晴雷: 我已经知道了，你可以看我主页帖子
深度学习基础-ReLU和Sigmoid对比
晴雷: 楼主，为什么二分类问题输出层的激活函数只能是sigmod的呢
paddle卷积BN合并
小 K 同学: 博主您好，请问有详细示例吗？我尝试自己训练的模型报错AttributeError: 'TranslatedLayer' object has no attribute
卷积神经网络里的attention机制
huhushengwei001: 代码通道卷积里面，是Line不是conv

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。