发布Google-Landmarks: 世界最大的人造和自然地标识别数据集

最新推荐文章于 2024-09-12 08:34:10 发布

weixin_33719619

最新推荐文章于 2024-09-12 08:34:10 发布

阅读量1.1k

点赞数

文章标签：人工智能数据库

本文链接：https://blog.csdn.net/weixin_33719619/article/details/86745885

版权

Google发布Google-Landmarks，一个包含200万张图像、覆盖3万个独特地标的大型地标识别数据集，旨在推动实例级识别技术的发展。数据集与Deep Local Features (DELF)一起开源，并作为Kaggle地标识别和检索挑战赛的一部分，提供给研究员和参赛者使用。

摘要由CSDN通过智能技术生成

文 / Google Research 软件工程师 André Araujo 和 Tobias Weyand

图像分类技术在过去几年取得了显著进步，例如在 Imagenet 分类挑战赛中，错误率每年都在大幅下降。为了继续推进计算机视觉的发展，许多研究员现在将更多精力放在精细和实例级识别问题上 - 许多人都在设计能够识别埃菲尔铁塔、富士山或波斯猫的机器学习算法，而不是识别建筑物、山峰和猫等一般实体。不过，这个领域一个比较大的研究障碍是缺乏大型的标注数据集。

我们高兴地宣布 Google-Landmarks，它是全世界最大的人造和自然地标识别数据集，希望这个工具能推动实例级识别的发展。Google-Landmarks 将作为地标识别和地标检索 Kaggle 挑战赛的一部分发布，这两个挑战赛将是 CVPR’18 Landmarks 专题讲座的重点。

地标识别挑战赛：https://www.kaggle.com/c/landmark-recognition-challenge
地标检索挑战赛：https://www.kaggle.com/c/landmark-retrieval-challenge

数据集包含超过 200 万个图像，这些图像描绘了全世界 3 万个独特的地标（它们的地理分布如下图所示），许多类别要比现在的常用数据集大 30 倍左右。此外，为了激励这个领域的研究，我们将开源 Deep Local Features (DELF):

http://arxiv.org/abs/1612.06321

这个具有专用的本地特征描述符的数据库，我们认为它非常适合这种任务。

发布Google-Landmarks: 世界最大的人造和自然地标识别数据集

我们数据集中的地标的地理分布

地标识别具有一些与其他问题显著不同的差异。例如，即使在一个大型标注数据集中，也可能没有很多用于一些不知名地标的训练数据。此外，由于地标通常是不可移动的刚性对象，类别内变化非常小（换句话说，地标的外观在它的不同图像中不会发生很大变化）。因此，变化仅来自于拍照条件（例如遮蔽、不同的视角、天气和光照），这就让地标与其他图像识别数据集不同，在其他数据集中，某种类别图像（例如狗）的差异可能非常大。其他实例级识别问题（例如艺术品识别）也有这些特性 - 因此，我们希望新数据集也能为其他图像识别问题的研究提供帮助。

两个 Kaggle 挑战赛会提供标注数据的访问权限，以便帮助研究人员解决这些问题。识别挑战赛的任务是构建识别正确地标的模型，它可以处理具有挑战性测试图像组成的数据集，而检索挑战赛的参与者需要检索包含相同地标的图像。

发布Google-Landmarks: 世界最大的人造和自然地标识别数据集