视觉分类任务中处理不平衡问题的loss比较

问题介绍在计算机视觉(CV)任务里常常会碰到类别不平衡的问题, 例如: 1. 图片分类任务,有的类别图片多,有的类别图片少 2. 检测任务。现在的检测方法如SSD和RCNN系列,都使用anchor机制。 训练时正负anchor的比例很悬殊. 3. 分割任务, 背景像素数量通常远大于前景像素。 从实质上来讲, 它们可以归类成分类问题中的类别不平衡问题:对图片/anchor/像素的分类
摘要由CSDN通过智能技术生成

问题介绍

在计算机视觉(CV)任务里常常会碰到类别不平衡的问题, 例如:
1. 图片分类任务,有的类别图片多,有的类别图片少
2. 检测任务。现在的检测方法如SSD和RCNN系列,都使用anchor机制。 训练时正负anchor的比例很悬殊.
3. 分割任务, 背景像素数量通常远大于前景像素。
从实质上来讲, 它们可以归类成分类问题中的类别不平衡问题:对图片/anchor/像素的分类。
再者,除了类不平衡问题, 还有easy sample overwhelming的问题。easy sample如果太多,可能会将有效梯度稀释掉。
这两个问题通常都会一起出现。 如果不处理, 可能会对模型性能造成很大伤害。用Focal Loss里的话说,就是训练不给力, 且会造成模型退化:

(1) training is inefficient as most locations are easy negatives…
(2) the easy negatives can overwhelming training and lead to degenerate models.

如果要处理,那么该怎么处理呢? 在CV领域里, 若不考虑修改模型本身, 通常会在loss上做文章, 确切地说,是在样本选择或loss weight上做文章。

常见的解决办法介绍

常见的方法有online的, 也有非online的;有只处理类间不平衡的,有只处理easy example的, 也有同时处理两者的。

  1. Hard Negative Mining, 非online的mining/boosting方法, 以‘古老’的RCNN(2014)为代表, 但在CV里现在应该没有人使用了(吧?)。若感兴趣,推荐去看看OHEM论文里的related work部分。
  2. Mini-batch Sampling,以Fast R-CNN(2015)和Faster R-CNN(2016)为代表。Fast RCNN在训练分类器, Faster R-CNN在训练RPN时,都会从N = 1或2张图片上随机选取mini_batch_size/2个RoI或anchor, 使用正负样本的比例为1:1。若正样本数量不足就用负样本填充。 使用这种方法的人应该也很少了。从这个方法开始, 包括后面列出的都是online的方法。
  3. Online Hard Example Mining, OHEM(2016)。将所有sample根据当前loss排序,选出loss最大的N个,其余的抛弃。这个方法就只处理了easy sample的问题。
  4. Oline Hard Negative Mining, OHNM, SSD(2016)里使用的一个OHEM变种, 在Focal Loss里代号为OHEM 1:3。在计算loss时, 使用所有的positive anchor, 使用OHEM选择3倍于positive anchor的negative anchor。同时考虑了类间平衡与easy sample。
  5. Class Balanced Loss。计算loss时,正负样本上的loss分别计算, 然后通过权重来平衡两者。暂时没找到是在哪提出来的,反正就这么被用起来了。它只考虑了类间平衡。
  6. Focal Loss(2017), 最近提出来的。不会像OHEM那样抛弃一部分样本, 而是和Class Balance一样考虑了每个样本, 不同的是难易样本上的loss权重是根据样本难度计算出来的。

从更广义的角度来看,这些方法都是在计算loss时通过给样本加权重来解决不平衡与easy example的问题。不同的是,OHEM使用了hard weight(只有0或1),而Focal Loss使用了soft weight(0到1之间).

现在依然常用的方法特性比较如下:

Method 是否处理Class Inbalance 是否处理Easy Example 权值方式
OHEM No Yes Hard
OHNM(OHEM 1:3) Yes Yes Hard
Class Balanced Loss Yes No Soft
Focal Loss No Yes Soft

接下来, 通过修改过的Cifar数据集来比较这几种方法在分类任务上的表现,当然, 主要还是期待Focal Loss的表现。

实验数据

实验数据集

Cifar-10, Cifar-100。 使用Cifar的原因没有别的, 就因为穷,毕竟要像Focal Loss论文里那样跑那么多的大实验对大部分学校和企业来说是不现实的。

处理数据得到类间不平衡

将多分类任务转换成二分类:

new_label = label == 1

原始Cifar-10和100里有很多类别,每类图片的数量基本一样。按照这种方式转变后,多分类变成了二分类, 且正负样本比例相差悬殊: 9倍和99倍。

实验模型

一个5层的CNN,完成一个不平衡的二分类任务。使用Cross Entropy Loss,按照不同的方法使用不同的权值方案。以不加任何权重的CE Loss作为baseline。

衡量方式

在这种不平衡的二分类问题里, 准确率已经不适合用来衡量模型的好与坏了。此处使用F-Score作标准.

实现细节

CE(Cross Entroy Loss)

J=1n1nlog(pt)

pt 的含义与Focal Loss论文里一致:
p=sigmoid(x
  • 29
    点赞
  • 128
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
### 回答1: Alpha IOU Loss是一种目标检测的损失函数,它将模型输出的边界框与真实边界框之间的交并比作为误差指标,以改善模型的预测精度。Alpha IOU Loss可以有效缓解训练模型时的偏移问题,使模型能够准确地检测出目标的物体。 ### 回答2: alpha IOU LOSS 是目标检测的一种损失函数,用于衡量预测框与真实框之间的重叠程度。在该损失函数,alpha 是一个超参数,用于控制正负样本的权重。 目标检测旨在从图像检测出目标的位置和类别。为了评估检测的准确性,需要计算预测框和真实框之间的重叠度。通常,一种常用的衡量指标是 IOU(Intersection over Union),即重叠区域面积与并集区域面积之比。 在使用 alpha IOU LOSS 进行目标检测时,首先对于每个真实框,在预测框集合找到与其 IOU 最大的预测框,并将其作为匹配。然后,计算匹配的预测框与真实框的 IOU 值。 在计算损失时,大致可以分为两种情况。如果 IOU 值大于一定阈值,表示匹配良好,可以认为预测正确,则损失较小或者为零。如果 IOU 值小于一定阈值,则匹配不良好,可能需要进一步调整预测框的位置或大小,损失较大。 在 alpha IOU LOSS ,引入了一个参数 alpha,用于动态调整正负样本的权重。对于 IOU 值大于阈值的预测框,将其作为正样本,损失较小;而对于 IOU 值小于阈值的预测框,将其作为负样本,损失较大。通过调整 alpha 的值,可以平衡正负样本之间的重要性。 总结来说,alpha IOU LOSS 是一种目标检测的损失函数,通过计算预测框与真实框之间的重叠度来衡量检测的准确性。通过引入 alpha 参数,可以调整正负样本的权重,进一步优化目标检测的效果。 ### 回答3: 目标检测的alpha IOU LOSS是一种损失函数,用于训练目标检测模型。目标检测是计算机视觉的一个重要任务,目的是在图像或视频准确地定位和识别出多个目标。 传统的目标检测模型通常使用交叉熵损失函数来训练,但这种损失函数在处理目标位置回归时存在一定的缺陷,如不平衡问题和尺度不变性问题。为了解决这些问题,alpha IOU LOSS被提出。 alpha IOU LOSS是基于IOU(Intersection over Union)的一种改进损失函数。IOU是目标检测常用的指标,用于评估模型预测框和真实框之间的重叠程度。alpha是一个可调整的参数,用于平衡定位精度和分类精度之间的权重。 在alpha IOU LOSS,首先计算预测框和真实框之间的IOU值,然后根据IOU值和alpha参数计算损失。当IOU值较高时,损失较低,鼓励模型预测框与真实框的重叠更多;而当IOU值较低时,损失较高,鼓励模型更好地预测目标位置。 相比传统的交叉熵损失函数,alpha IOU LOSS在目标位置回归更具优势。它能够有效解决定位精度和分类精度不平衡问题,并且通过引入IOU作为指标,使得模型更加关注目标的位置信息。这种损失函数的引入可以提升模型的准确性和稳定性,在目标检测任务有较好的效果。
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值