【长尾学习】Context-rich Minority Oversampling for Long-tailed Classification 论文阅读



TitleThe Majority Can Help the Minority: Context-rich Minority Oversampling for Long-tailed Classification
AuthorsSeulki Park, Youngkyu Hong, et.al. 首尔国立大学、NAVER AI Lab
PublicationCVPR 2022
TagTransfer Learning + Data Augmentation
Codehttps://github.com/naver-ai/cmo
Contribution多张多数类充当一张少数类图片的背景来扩充少数类样本的数量

1. Abstract

1.1 先前的问题

  • 重复地对少数类进行超采样会加剧过拟合,这是因为重复选择的样本不够具有多样性,而且图片上下文背景几乎相同。如下图所示:

    image-20220928082423452

  • 先前的重新采样策略都忽略了多数类中蕴含的丰富的上下文背景信息,本文就是要充分利用多数类中的这些上下文背景信息来生成更多新的少数类图片。

1.2 解决方案

  • 核心思想:提出一种全新的少数类超采样策略 Context-rich Minority Oversampling (CMO) 。把少数类的一张图片 “粘贴” 到多张上下文背景丰富 (rich-context) 的多数类图片上,让这些多数类的图片充当背景。这样,一张少数类图片就能超采样成背景不一样的多张新图片了。

  • 如下图所示,一张少数类的白鹅生成了 4 张背景不同的新样本:

    image-20220928083044214

  • 优点:方法简单,易于与现有的长尾识别方法结合;

2. 研究灵感来源

  • 论文原文CutMix: Regularization Strategy to Train Strong Classifiers with Localizable Features (ICCV, 2019)

  • 原文缺点:直接套用 CutMix 到长尾学习中会加剧多数类的过拟合。这是因为该策略可能会生成更多以多数类为中心的图片,而 ”粘贴“ 到上面的少数类反而容易成了背景。

  • 优化方案:本文通过对不同分布的背景图片和前景块进行采样来解决这个问题。

3. Details

3.1 算法

image-20220928101656947

3.2 一些由CMO生成的少数类图片

image-20220928114125444

4. Experience

4.1 实验条件

① 数据集

数据集名称描述
CIFAR-100-LT基于 CIFAR-100 人工制作成长尾分布的数据集
ImageNet-LT基于 ImageNet-2012 人工制作成长尾分布的数据集
iNaturalist 2018大规模的真实世界数据集,天然地表现出长尾的不平衡性

image-20220928111643346

② 评价指标

  • 使用 top-1 准确率;

  • 同时还划分了三个子集的准确率:

    评价指标描述
    头部类准确率训练样本数量在100个以上的类别的平均精度
    中部类准确率训练样本数量在20 ~100个的类别的平均精度
    尾部类准确率训练样本数量在20个以下的类别的平均精度

③ 实验参数

数据集CIFAR-100-LTImageNet-LTiNaturalist 2018
主干网络ResNet-32ResNet-50ResNet-{50, 101, 152} 和 Wide ResNet50
epochs200100200
学习率0.1,在60和80epoch衰减0.1,在60和80epoch衰减0.1,在75和160epoch衰减
权重更新策略SGDSGDSGD
momentum0.90.90.9

4.2 三个长尾基准的有效性

① CIFAR-100-LT

image-20220928113302356

image-20220928113334637

② ImageNet-LT

image-20220928113758342

image-20220928113811611

③ iNaturalist 2018

image-20220928114018268

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

自牧君

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值