阅读小结：The Unreasonable Effectiveness of Noisy Data for Fine-Grained Recognition

最新推荐文章于 2021-08-27 20:35:07 发布

Layumi1993

最新推荐文章于 2021-08-27 20:35:07 发布

阅读量1.7k

点赞数 1

分类专栏：论文阅读文章标签： CNN 细力度分类 fine-grained

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Layumi1993/article/details/53577204

版权

论文阅读专栏收录该内容

27 篇文章 0 订阅

订阅专栏

The Unreasonable Effectiveness of Noisy Data for Fine-Grained Recognition

paper link: http://cn.arxiv.org/pdf/1511.06789.pdf

dataset: https://github.com/google/goldfinch

What:

同上一篇一样，这也是一篇关于细力度分类的paper。

通过加数据来做fine grain（这是以前大家不太想的。因为finegrain要求的标注难度很高。更不用说加上part或者语义分隔。

所以作者起的题目是unreasonable吧。）

How：

1.抓取类别list

对于鸟和昆虫（磷翅类：蝴蝶和甲虫），分别从wiki上抓了10,982种鸟和14,553种昆虫。

对于aircraft，是人为写了一个409类的list。

对于狗，混合了原来stanford-dog 120类和额外的395类。共515种狗。

2.直接在谷歌图片网站上搜索，获取图片

－但是应该取多少图片？

－作者注意到几个趋势：

- 往往数据集中已有的类别图片较多。但数量还是远远少于搜索到的结果。

- 像bird或者aircraft数据集中per class 图片的数量还是很多的。而butterfly不行。

- 数据集在 per class＝800的时候都有明显下降。图片数量超过800的class很少。这似乎是一个公开搜索的限制。（因为作者搜集的数据超过800的也很少）

最终作者抓取了超过 9,800,000张图，给26,548 个类别平均每类370+张图片。

－ noise怎么办？

－ noise可以分为两类：一类是cross-domain，比如鸟的图片里完全没有鸟；一类是cross-category，比如某种鸟的图像里含有了另一种鸟。

为了量化cross-domain noise，作者人工标注了1000张图片。虽然每一类的cross-domain noise不多，但有一个有趣的关联：随着每一类的图片增多，cross-domain noise在减少。作者得到一个假设，搜索结果其实是一个pool从中得到搜索结果，因此搜索结果慢慢变得准确率高了。

而cross-category noise就难了。（缺乏细力度的标注）作者用了最简单的办法，排除那些搜索结果重复的图片。（搜鹦鹉你出现了，搜犀鸟你又出现了，那你就是流氓）

小结：作者说他们也用过一些技术去除cross－domain，但是发现对结果影响不太重要。所以他们后来就保留了这些noise，主要去除cross-category

3.active learning

另外，作者还提出了一种收集数据集的方法。noise data＋annotation。在学习过程中慢慢加入新的图片。

sample selection：是按照预先训练好的分类器的置信度分布去采样的，一般高conf的样本对的多。

而不是采样那些uncertain的图片（因为不确定的图片往往质量也不好，所以才被分在边界上嘛）

human annotation：

作者还设计了一个交互界面。

小结：文章整体提供了一个抓数据的方案。细节都make sense 的～

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Layumi1993 CSDN认证博客专家 CSDN认证企业博客

码龄8年

50: 原创

4万+: 周排名

210万+: 总排名

28万+: 访问

: 等级

2752: 积分

505: 粉丝

161: 获赞

92: 评论

366: 收藏

私信

关注

热门文章

分类专栏

最新评论

行人重识别（行人再识别）数据集 DukeMTMC-reID
wangxin19951113: 你好，请问你下载到duke mtmc这个数据集了吗？可否分享一下，谢谢
matlab中在图像上划线画圈的方法
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)；(2)使用标准目录；(3)增加除了各种控件外，文章正文的字数。
【新无人机数据集】从行人重识别到无人机目标定位
Layumi1993: 是可以的。可以关注天津大学朱鹏飞老师他们有一些无人机视角人群计数的数据集。
【新无人机数据集】从行人重识别到无人机目标定位
蟹老板我下班了: 从无人机航拍的视角中能识别出行人的头部吗，也就是自动识别航拍视频中的行人（基本上是90度俯视）
一个新的开始
Wendy J: 看到楼主今年拿到了ieee的表彰！恭喜恭喜！楼主用五年成为了领域大佬！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Layumi1993 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。