内容一览:本期整理了 HyperAI超神经官网近期更新的 9 个数据集,涉及人脸识别、姿态估计、自动驾驶三个领域。
关键词:人脸识别 姿态估计 自动驾驶
本文首发自微信公众号:HyperAI 超神经
近期,HyperAI超神经官网更新了 300+ 优质公开数据集,数据模态涉及图像、视频、音频、RGB-D 等。
本文整理汇总了 9 个具有代表性的数据集,大家按需下载使用。
直达 HyperAI超神经数据集传送门:
人脸识别 (Face Recognition)
人脸识别是计算机视觉项目的应用之一。在人脸识别的训练中,训练的数据量大、质量稳定、没有「杂质」,是研究中非常好的优质数据库。
VGG-Face2 人脸识别数据集
VGG-Face2 数据集,是一个人脸图片数据集。
数据集中图像均来自 Google 图片搜索。数据集中的人在姿势、年龄、种族和职业方面有很大差异。
VGG-Face2 Dataset
发布机构: 牛津大学
包含数量: 331 万张图片
数据格式: images
数据大小: 37.49 GB
发布时间: 2017 年
Helen 人脸数据集
HELEN 数据集由 2,330 张 400*400 像素的人脸图像组成。该数据集包括 2,000 张训练图像和 330 张测试图像,带有高度准确的、详细和一致的人脸主要组成部分标注。
Helen Dataset
发布机构: 伊利诺斯大学
包含数量: 2,330 张 400*400 像素的人脸图像
数据格式: images
数据大小: 1.02 GB
发布时间: 2012 年
FairFace 人脸数据集
FairFace 是一个更种族均衡的人脸图像数据集。 该数据集包含 108,501 张图片,设及 7 个不同种族群体(白人、黑人、印度人、东亚人、东南亚人、中东人和拉丁裔)。
FairFace Dataset
发布机构: 加州大学洛杉矶分校
包含数量: 108,501 张图片
数据格式: images
数据大小: 2.49 GB
发布时间: 2020 年
下载地址: hyper.ai/datasets/17876
姿态估计 (Human Pose Estimation)
姿态估计是利用某种几何模型或结构来表示物体的结构和形状。 当前存在的难点包括背景复杂、复杂姿态样本少等。
MPI-INF-3DHP 3D 人体姿态估计数据集
MPI-INF-3DHP 是一个 3D 人体姿态估计数据集,图像有室内和室外环境。 该数据集包含 130 多万帧图像,由 14 个摄像角度记录 8 位参与者的 8 类活动。
MPI-INF-3DHP Dataset
发布机构: 萨尔州大学
包含数量: 130 多万帧图像
数据格式: video
数据大小: 21.77 GB
发布时间: 2016 年
HandNet 手部姿势数据集
HandNet 手部姿势数据集包含 10 位参与者的手在 RealSense RGB-D 相机前非刚性变形的深度图。该数据集共包含 214,971 张深度图,其中训练集 202,198 张,测试集 10,000 张,验证集 2,773 张。
HandNet Dataset
发布机构: 以色列理工学院
包含数量: 214,971 张图像
数据格式: images
数据大小: 12.85 GB
发布时间: 2015 年
3DPW 姿态数据集
3DPW 全称 3D Poses in the Wild,是首个具有精确 3D 姿态的户外数据集,可用于解决姿态估计问题。 该数据集包括 60 个视频序列,3D 人体扫描和 3D 人物模型。
3DPW Dataset
发布机构: 汉诺威莱布尼兹大学
包含数量: 60 个视频序列
数据格式: video
数据大小: 4.55 GB
发布时间: 2018 年
下载地址: hyper.ai/datasets/16463
自动驾驶 (Self-Driving)
人工智能在自动驾驶与可以担任驾驶员这一角色,通过对道路上发生的各种状况信息进行搜集、分析和处理,做出操作代替人为操控。
Comma.ai 自动驾驶视频数据集
Comma.ai 数据集是一个用于自动驾驶的视频数据集。 包含共计 7.25 小时的视频,该数据集包含 10 个以 20Hz 频率记录的视频。该数据集还包括如汽车时速、加速度、转向角、GPS 坐标、陀螺仪角度等的测量值。
Comma.ai Dataset
发布机构: Comma.ai 公司
包含数量: 7.25 个小时视频
数据格式: video
数据大小: 44.96 GB
发布时间: 2016 年
下载地址: hyper.ai/datasets/5200
Argoverse 自动驾驶数据集
Argoverse 数据集包含 3D Tracking 和 Motion Forecasting 两部分。
Argoverse 3D tracking 数据集包含 113 个场景的 3d 跟踪注释。 每个片段长度为 15-30 秒,共计包含 11319 个跟踪对象。在训练集和测试集的每个片段场景中包含了五米内的所有物体的注释,可被理解为检测汽车可驾驶区域(5 米)的所有物体,以 3d 框架形式展现。该数据集可被自动驾驶等领域使用。
Argoverse Motion Forecasting 数据集为运动预测类模型的数据集, 包含 327793 个场景,每个场景时常 5 秒,且包含以 10 Hz 采样的每个跟踪对象的 2D 鸟瞰图。该数据集是由超过 1000 小时的街道驾驶所获取,可用于自动驾驶等领域的研究。
Argoverse Dataset
发布机构: ARGO AI
包含数量: 超过 3 万个场景
数据大小: 260.38 GB
发布时间: 2019 年
Talk2Car 自动驾驶数据集
Talk2Car 数据集是一个对象引用数据集,包含了用自然语言为自动驾驶汽车编写的命令,即乘客可以通过说话的形式对自动驾驶汽车下达命令。
Talk2Car 数据集建立在 nuScenes 数据集之上,包括一套广泛的传感器模式,即语义地图、GPS、激光雷达、雷达和带有 3D bounding box 标注的 360° RGB 图像。
Talk2Car Dataset
发布机构: 比利时鲁汶大学
数据格式: images
数据大小: 1.65 GB
发布时间: 2019 年
搜索或下载数据集,访问以下链接:
—— 完 ——