四个动作识别数据集的简介

1、UT-Interaction数据集
包含6类人与人交互的视频:挥手,指向,拥抱,推,踢和用拳猛击。总共有20个视频序列的长度约为1分钟。每个视频每个交互至少包含一次执行,为每个视频平均提供8次人类活动的执行。视频中会出现多个有超过15种不同类型服饰的参与者。视频采用720 * 480,30fps的分辨率拍摄,视频中人物的高度约为200像素。
将视频分成两组。一组在停车场拍摄,由10个视频序列组成。视频采用稍微不同的缩放比例,其背景大部分是静态的,而且相机抖动很小。第二组(即其他10个序列)在处于刮风天气的草坪上拍摄。背景略有变动(例如树移动),也包含更多的相机抖动。从序列1到4以及从11到13,场景中只出现两个互动人物。从序列5到8和从14到17,场景中都有相互作用的人和行人。在第9,10,18,19和20组中,几对相互作用的人同时执行这些活动。每组具有不同的背景,拍摄比例和照明情况。

2、CAVIAR Test Case Scenarios CAVIAR测试用例场景
拍摄多种情况下的情景,视频内容包括人们独自行走,与他人见面,购物,进出店铺,打架、昏厥和在公共场所留下一个包裹。
第一部分视频剪辑是在实验室入口大厅用广角相机镜头拍摄的。大多数剪辑从一个成员以身体和手势示意场景的开始。
第二组数据在购物中心和沿着走廊使用广角镜头拍摄。对于每个序列,从两个不同的角度进行记录,都有两个时间同步的视频,其中一个视角沿着走廊,另一个视角横跨走廊的正面。
分辨率是PAL制式的一半分辨率(384 x 288像素,每秒25帧)并使用MPEG2进行压缩。 文件大小主要在6到12 MB之间,有几个高达21 MB。

3、BEHAVE Interactions Test Case Scenarios交互测试用例场景
数据集包含两种不同视角下人们进行各种互动的场景,包括十个基本情景。视频以每秒25帧的速度拍摄。 分辨率是640x480。数据以AVI或一组JPEG图像的文件形式提供。
引用形式: S. J. Blunsden, R. B. Fisher, “The BEHAVE video dataset: ground truthed video for multi-person behavior classification” , Annals of the BMVA, Vol 2010(4), pp 1-12.

4、UCF101
UCF101是从YouTube收集的具有101个动作类别的真实动作视频的动作识别数据集。该数据集是UCF50数据集的扩展,其中包含50个操作类别。
从101个动作类别的13320个视频中,UCF101在动作方面提供了最大的多样性,并且相机运动,物体外观和姿态,物体比例,视点,背景混乱,照明条件等方面存在较大差异,它是最具有挑战性的数据集迄今。由于大多数可用的行动识别数据集不现实并由行动者进行演示,因此UCF101旨在鼓励通过学习和探索新的实际行动类别来进一步研究行动识别。
101个动作类别中的视频被分组为25个组,其中每个组可以包含4-7个动作视频。来自同一组的视频可以共享一些共同的特征,诸如相似的背景,类似的观点等等。
动作类别可以分为五种类型:1)人 - 物体互动2)身体动作3)人与人之间的互动4)演奏乐器5)运动。

  • 2
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Emotionet数据集是一个用于情感识别任务的大规模图片数据集。它由国外的研究机构创建,用于帮助开发和评估情感识别算法。 Emotionet数据集包含超过28万张真实世界中的人脸图片,涵盖了丰富的情感表达,包括喜悦、悲伤、恐惧、厌恶、愤怒等等。每张图片都有明确的标签,指示了该图片中人物所表达的情感。 这个数据集的规模很大,并且包含的情感类型也很丰富,所以它被广泛用于情感识别方面的研究和应用。研究人员可以使用Emotionet数据集来训练和测试情感识别算法,以帮助计算机更好地理解和解读人类的情感表达。 Emotionet数据集的建立对于情感识别的发展非常重要。通过使用这个数据集,研究人员可以对情感识别算法进行大规模的训练和评估,从而提高情感识别的准确性和鲁棒性。 然而,值得注意的是,Emotionet数据集的使用受到一些隐私和伦理方面的限制。因为这些图片是从真实世界中收集而来的,所以必须确保在使用和处理这些图片时尊重个人隐私和数据保护的原则。 总的来说,Emotionet数据集对于情感识别领域的研究和应用有着重要意义。它提供了一个丰富多样的图片资源,可以帮助研究人员开发更准确和可靠的情感识别算法,从而在诸如人机交互、社交媒体分析等领域发挥巨大作用。 ### 回答2: Emotionet数据集是一个用于情绪识别研究的大型数据集。它包含了来自不同情绪状态的图像和视频数据。该数据集的目的是帮助研究人员进一步了解情绪识别的方法和技术,并提供一个用于训练和评估情绪识别算法的标准数据集。 Emotionet数据集中的图像和视频数据来自不同的情绪类别,如快乐、悲伤、恐惧、厌恶、愤怒和惊喜等。每个情绪类别包含了大约数千个图像和视频样本,以确保数据集的多样性和丰富性。 对于图像数据,每个样本都有对应的标签,表示该图像所属的情绪类别。研究人员可以使用这些标签来训练机器学习模型,并对其进行情绪识别测试。此外,数据集还提供了每个情绪类别的描述和额外的相关信息,以帮助研究人员更好地了解数据。 对于视频数据,每个样本都是以帧的形式给出的。每个帧都有相应的情绪标签,经过时间顺序排列,以便进行情绪在视频中的连续识别研究。这使得研究人员可以更好地理解情绪在视频中的变化和发展。 Emotionet数据集的创建和维护是经过仔细设计和标注的,以确保数据的质量和可靠性。由于其广泛的情绪类别和丰富的图像和视频样本,Emotionet数据集已成为情绪识别研究领域中的重要资源,被广泛应用于学术界和工业界。 总之,Emotionet数据集是一个用于情绪识别研究的大型数据集,包含了来自不同情绪状态的图像和视频样本。它提供了标签和额外信息,用于帮助研究人员深入研究情绪识别算法。这个数据集在情绪识别领域中具有重要的研究价值和应用潜力。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值