triplet loss 图像检索_Recall Loss:用于不平衡图像分类和语义分割的召回损失

a5464fb308a59ff24affb2f7dfebaeb9.png

本文针对不平衡图像分类和语义分割问题,提出了一种基于度量召回的新损失函数:Recall Loss,很好地平衡了精度和准确性,可显著提高不平衡图像分类和不平衡语义分割任务的性能。

Recall Loss for Imbalanced Image Classification and Semantic Segmentation

853e3dceb47f6983ed04bc366002d177.png
论文(ICLR 2021投稿):Recall Loss for Imbalanced Image Classification and Semantic...

注:如果上述论文链接无法访问,可以看文末,论文已上传至百度云,方便下载。

【主要贡献】

  • 我们基于metric recall引入了一种新颖的损失函数。Recall loss以其瞬时训练召回性能权衡每个类的标准交叉熵损失。
  • 提出的召回损失学习了更好的语义分割模型,该模型提供了准确性和IoU更高且平衡的性能。 我们证明了合成和真实语义分割数据集的损失。
  • 提出的损失还改善了图像分类中的特征学习。 我们使用简单的去耦网络在两个常见的分类基准上显示了最新的结果。

类别不平衡是诸如语义分割和图像分类之类的计算机视觉应用中的基本问题。具体而言,训练数据集中的类别分布不均匀通常会导致在代表性不足的类别上的表现不令人满意。许多工作提出了基于类别统计信息(例如样本数量和类别裕度)使用预先计算的权重来衡量标准交叉熵损失函数。这些方法有两个主要缺点:

1)不断增加权重的少数类会引入过多的误报,尤其是在语义分割中;

2)最近的许多工作发现,预先计算的权重会对表示学习产生对抗性影响。

在这方面,我们通过重塑原交叉熵损失来提出一种hard-class mining损失,从而根据召回性能的变化动态加权每个分类的损失。我们用数学方法表明,新颖的召回损失在标准交叉熵损失和众所周知的inverse frequency交叉熵损失之间逐渐变化,并平衡了精度和准确性。

从Inverse Frequency Loss到 Recall Loss:

0829efde57120086396e0a273ed81499.png

从Focal Loss到 Recall Loss:

780f3f1b639523438edc3b1efbda3f0f.png

6ac89d4e11986a0a3970e1dfcbfff625.png

实验结果

我们首先证明,所提出的损失有效地平衡了语义分割数据集的precision and accuracy ,并且与语义分割中使用的其他现有损失函数相比,尤其是在浅层网络上,带来了显著的性能改进。

cdb2760e83ff7c1edb89393352325bb1.png

04b5e56c44bcad3c7ac544ababe12f73.png

在图像分类上,我们设计了一种简单的两头训练策略,以表明新颖的损失函数可以改善不平衡数据集上的表示学习。在Place365-LT和iNaturalist上,我们的性能优于以前最佳的方法。

72242e8f4422c2b71696691e1d62a104.png

论文下载

链接: https:// pan.baidu.com/s/1BjsdBl EP5d3aKVuvGLzqXQ
提取码:cver

强烈推荐大家关注CVer知乎账号和CVer微信公众号,可以快速了解到最新优质的CV论文。

推荐阅读

即插即用!Rotate to Attend:卷积Triplet注意力模块

旷视提出MegDetV2:目标检测/实例分割系统

综述 | 基于深度学习的医学图像分割技术:全面调研

ResNet还是DenseNet?即插即用的DS涨点神器来了!

综述 | 基于深度学习的端到端人脸识别技术:全面调研

TBC:共享Thinner Filters,实现更强的CNN!

综述 | 行人检测技术(从手工特征到深度学习):全面调研

超越EfficientNets!无需注意力,也能让你的网络更快更强!

OpenCV 4.5来了!更强的SIFT,改进RANSAC算法,新增目标跟踪网络SiamRPN++

综述 | 基于深度学习的实时语义分割方法:全面调研

涨点神器!南航提出AFF:注意力特征融合

NeurIPS 2020 | 谷歌大脑提出:重新思考预训练和自训练

NeurIPS 2020 | 用于图像复原/恢复的神经稀疏表示

NeurIPS 2020 | aLRPLoss:统一目标检测中的分类和定位的平衡损失函数

CCE:具有互补交叉熵的不平衡图像分类

谷歌地标检索2020 Kaggle 第一名解决方案

ECCV AIM 2020 真实图像超分辨率挑战赛3项冠军解决方案

LVIS 实例分割挑战赛2020的第一名解决方案:好的Box不能保证好的Mask

ETH Zurich提出DPIR:具有Denoiser先验的即插即用图像恢复

综述 | 人脸图像质量评估:全面调研(2004-2020)

VarifocalNet:IoU-aware 密集目标检测器(已开源)

ECCV 2020 | NAS-DIP:通过NAS实现DIP(去噪/去雾/超分辨率/修复等)

TIP 2020 | PNEN:金字塔Non-Local增强型网络

综述 | 小样本学习:全面调研(Few-shot)

MiCo:用于半监督域自适应的Mixup联合训练

使用深度神经网络从Noisy Labels中学习:全面调研

PyTorch3D:面向3D计算机视觉的PyTorch工具箱

剪枝filter?还是剪枝layer?这是个问题

ECCV 2020 | WeightNet:重新探索Weight网络的设计空间

Mask TextSpotter v3:用于场景文字检测和识别的分割Proposal网络

ECCV 2020 | 魔鬼在细节中:车辆重识别的自监督注意力(SAVER)

ECCV 2020 | 53.5 AP!PAA:用于目标检测的IoU预测的概率Anchor分配

ECCV 2020 | 南京理工提出FPT:特征金字塔Transformer

ECCV 2020 | 长尾数据集中多标签分类的分布平衡损失

ECCV 2020 | BMask R-CNN:边界保持的Mask R-CNN

ECCV 2020 | 即插即用!PSConv:将特征金字塔压缩到紧凑的多尺度卷积层中

ECCV 2020 | STTN:用于视频修复的时空联合Transformer

ECCV 2020 | LiteFlowNet3:实现更准确的光流估计

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值