发布 Open Images V6:新增局部叙事标注

Google Research 发布了 Open Images V6,大幅扩展了视觉关系和人类动作标注,并引入了局部叙事标注,这是一种结合语音、文本和鼠标轨迹的新标注形式,旨在增强视觉与语言的联系。新版本包含约50万张带有局部叙事的图像,以及大量视觉关系和人类动作标注,将进一步推动计算机视觉和图像理解研究。
摘要由CSDN通过智能技术生成

文 / Jordi Pont-Tuset,研究员,Google Research

在许多方面,Open Images 都可堪称为最大的标注图像数据集,可为计算机视觉任务训练最新深度卷积神经网络。去年 5 月发布的第 5 版 Open Images 数据集中有 900 万张有标注图像(含 3600 万个图像级标签、1580 万个边界框,280 万个实例分割以及 39.1 万个视觉关系)。该数据集本身以及围绕它展开的 Open Images 挑战赛,共同推动了物体检测、实例分割和视觉关系检测领域取得了最新进展。

Open Images V5 采用如下标注形式:图像级标签、边界框、实例分割和视觉关系。图像来源:1969 Camaro RS/SS 由 D. Miller 拍摄、房屋照片由 anita kluska 拍摄、Calico 猫咪咖啡馆新宿店由 Ari Helminen 拍摄、Radiofiera - 蒙泰基奥马焦雷 Villa Cordellina Lombardi (VI) - agosto 2010 由 Andrea Sartorati 拍摄。所有图像的使用均遵循 CC BY 2.0 许可

今天,我们宣布 Open Images V6 已正式发布,此版本通过增加大量的视觉关系(例如“狗抓飞盘”)、人类动作标注(例如“女子跳起”)和图像级标签(例如“佩斯利”)大幅扩展了 Open Images 数据集的标注范围。

值得注意的是,新版本还添加了 局部叙事标注 (localized narrativ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值