Pytorch学习(二十七)-------- 针对不均衡数据集的重采样Resample

本文介绍了如何使用Pytorch应对类别不均衡数据集的问题,通过WeightedRandomSampler进行重采样,防止过拟合。文章详细讲解了WeightedRandomSampler的用法,并给出了具体代码示例,强调了设置label和shuffle参数的重要性。
摘要由CSDN通过智能技术生成

总说

针对类别数目不均匀的数据,有些类图片多,有些少,如果直接训练,那么就会造成过拟合类别多的数据。最简单的方法就是重采样,直接根据每一类的数目,来重新分配权重。你想想,普通肯定是均匀概率采样的,自然数目多的图片,采样到的概率就大。

神奇的 WeightedRandomSampler

直接丢代码

# 数据集中,每一类的数目。
 class_sample_counts = [150, 200, 300]
 weights = 1./ torch.tensor(class_sample_counts, dtype=torch.float)
# 这个 get_classes_for_all_imgs是关键
 train_targets = train_dataset.get_classes_for_all_imgs()
 samples_weights = weights[train_ta
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值