HOI 研究加速站：精选开源数据集分享

virtaitech

已于 2024-09-03 16:59:43 修改

阅读量682

点赞数 19

文章标签：人工智能 gpu算力 AI 数据库

于 2024-08-26 14:43:22 首次发布

本文链接：https://blog.csdn.net/m0_49711991/article/details/141563794

版权

Human Object Interaction (HOI) 是计算机视觉和人工智能领域的一个研究方向，主要关注人类与物体之间的交互行为的识别和理解。HOI 任务旨在识别图像或视频中人类与物体之间的互动，例如“一个人拿着杯子”或者“一个人坐在椅子上”。这一任务对于实现更高层次的场景理解非常重要，也在自动驾驶、机器人、智能监控等应用中具有广泛的应用前景。

本文分享几个人物交互开源数据集，旨在为科研探索者装备一把锐利的工具，助力他们在研究征途中披荆斩棘，迈向更加辉煌的成就巅峰。

HICO-Det

HICO-Det 数据集包括 47,776 张图片（38118 张用于训练，9658 张用于测试），80 种物体，涵盖了超过 117 种常见的动作，总计 600 种以上的 human-object interaction。

下载地址：https://drive.google.com/file/d/1dUByzVzM6z1Oq4gENa1-t0FLhr0UtDaS/view
论文地址：https://www.cv-foundation.org/openaccess/content_iccv_2015/papers/Chao_HICO_A_Benchmark_ICCV_2015_paper.pdf

V-COCO

V-COCO 是一个基于 COCO 创建的数据集，共 10,346 张图像（2,533 张用于训练，2,867 张用于验证，4,946 张用于测试）和 16,199 个人物实例。每个人都有 29 个动作类别的注释，并且没有包括对象在内的交互标签。

下载地址：https://github.com/s-gupta/v-coco

HOI-A

HOI-A 数据集在 HOI-W 数据集的基础上进行升级与扩展，共收录 38,668 张标注图像，涵盖了 11 种物体和10 种动作。具体来说，数据集中包含 43,820 个人体实例、60,438 个物体实例和 96,160 个交互实例。平均每人执行 2.2 次交互，增强了数据集的复杂性和实用性。

就每个交互类别的图像数量而言，是最大的 HOI 数据集。

HOI-A数据集中对应物体的动作列表及其出现实例

项目地址：https://github.com/YueLiao/PPDM
下载地址：https://drive.google.com/drive/folders/15xrIt-biSmE9hEJ2W6lWlUmdDmhatjKt
论文地址：https://openaccess.thecvf.com/content_CVPR_2020/papers/Liao_PPDM_Parallel_Point_Detection_and_Matching_for_Real-Time_Human-Object_Interaction_CVPR_2020_paper.pdf

HAKE

HAKE 数据集包括约 118,000 幅标注图像，其中包含约 285,000 个人体实例，约 25 0,000 个交互目标，以及 724,000 个具有人体部件状态的人一物交互对。

基于 HAKE 数据集构建了 PaStaNet-HOI 数据集，共约 110,000 幅标注图像（77,260 张用于训练，11,298 张用于验证，22,156 张用于测试）。

另外，PaStaNet-HOI 摒弃了“无交互”类别，由 116 种交互关系和 80 种物体类别组成了 520 种人一物体交互关系类别。

项目地址：http://hake-mvig.cn/home/
下载地址：http://hake-mvig.cn/download/
论文地址：https://arxiv.org/abs/2202.06851

H²O Interaction

H²O 是一个专注于提升人-物体及人-人交互检测能力的图像标注数据集，其构建基础为V-COCO 数据集，包含其中 10,301 张富含人-物体交互信息的图像，还额外增添了 3,635 张专注于展现复杂人-人互动场景的图片。

dataset-cover

下载地址：https://www.kaggle.com/datasets/angeliqueloesch/ho-interaction-dataset

HCVRD

HCVRD 是阿德莱德大学构建的一个大规模的以人为中心的视觉关系检测数据集。与以前发布的数据集相比，这个数据集包含了大量的关系注释，类别多达近 10,000 个。这种广泛的标签空间更准确地反映了现实世界中的人-物交互（HOI）。与 HICO-DET 和 V-COCO 不同，HCVRD 不仅关注交互关系，还包括人与物体之间的相对位置关系。

论文地址：https://cdn.aaai.org/ojs/12260/12260-13-15788-1-2-20201228.pdf
项目地址：https://github.com/bohanzhuang/HCVRD-a-benchmark-for-large-scale-Human-Centered-Visual-Relationship-Detection

汇聚全球智慧，推动技术进步

趋动云致力于打造一个开放的数据集社区，基于我们强大的数据平台，创新企业、机构、高校研究组、个人开发者都可以轻松访问、共享和更好地管理海量的开放数据。

目前，趋动云数据集社区已上线近 2,000 条精心整理的数据集，为 AI 科研探索者构建了一个丰富多元、高效便捷的数据宝库。我们诚挚邀请每一位求知若渴的科研先锋踏入这片智慧沃土，共同挖掘数据背后的无限价值，携手推动 AI 科技的飞跃进步。

❝
趋动云是面向企业、科研机构和个人 AI 开发者构建的开发和推理训练服务，也是全球首个基于 GPU 算力池化云的服务。

趋动云的使命是连接算力·连接人：

📍通过连接全球算力，趋动云可以为用户提供便宜、好用的 AI 算力。
📍通过为AI算法开发全流程提供优化服务、构建全球开发者项目和数据社区，趋动云可以帮助AI开发者接入丰富的生态，快速实现最佳实践。

趋动云