论文笔记：DLWL: Improving Detection for Lowshot classes with Weakly Labelled data

最新推荐文章于 2024-08-23 15:30:45 发布

qcs116

最新推荐文章于 2024-08-23 15:30:45 发布

阅读量342

点赞数 1

分类专栏：论文阅读笔记文章标签：图像处理 ieee论文

本文链接：https://blog.csdn.net/qcs116/article/details/112518114

版权

1 篇文章 0 订阅

订阅专栏

使用弱标签数据改进对Lowshot类的检测

课程学习中遇到的论文，将阅读笔记记录此处

lowshot class:
数据集中单个图像含有很少边界框注释的图像类别(<10)。
在这里插入图片描述

highshot class:
数据集中单个图像含有大量边界框注释的图像类别（>10)。
在这里插入图片描述

weakly labelled data:
只含有图像级标签的图片数据。
在这里插入图片描述

对象检测模型在诸如COCO等标准数据集上取得了巨大的成功;
但是当使用较大的数据集（比如：LVIS），遇到边界框少于十个的低密度类图像时效果欠佳；
其次，网络上含有大规模含有图像级标签的数据。

使用具有图像级标签的弱标记网络级数据集来提高对低密度类图像的检测。

改进的FRCNN(Faster R-CNN)
使用数据：
a. 使用少量全标签数据帮助更好的定位，形成边界框；
b. 使用大量弱标记图像帮助推断边界框的标签。
在这里插入图片描述

在这里插入图片描述
该框架同时使用弱标记和强标记示例来训练FRCNN模型。如果提供的示例具有边界框，则使用具有IoU匹配的标准绿色模块将标签分配给生成的边界框；否则将使用带有约束的线性程序来推断边界框的标签，如上图黄色区域。

在这里插入图片描述
左下方显示的是对类别的不同假设，每种颜色表示一种类别。
左上图表示每个假设的评分，这里用红色和蓝色表示汽车和摩托车的最高评分。
标签的最终分配如右图。

1.COCO-train:
含有大量highshot类数据（70个）和少量lowshot类数据（10个）；

2.子集：
a. COCO-N-strong:
此子集只保留来自10个Lowshot类的每个N个训练图像和所有的Highshot类图像。
b. COCO-N-weak:
COCO-train去除COCO-N-strong的图像。
~~删除文本~~

本实验：DLWL
对比实验1：lowshot-only（仅使用含有少量边界框的图像训练）
对比实验2：omni-weak（使用全监督方法和弱标签数据）
在这里插入图片描述

本篇只是对本论文的总体概述，能力有限，还有很多细节没有涉及。

关注