Activity Recognition行为识别

本文介绍了计算机视觉领域的行为识别技术,包括低、中、高三层结构的视频理解方法,如Bag of Features、时空特征、2D骨架检测、轨迹描述子等。还涉及到Action Bank的概念,以及基于人体姿势和部分的活动识别技术。KLT特征跟踪、密集轨迹和Action Bank特征向量用于提升识别效果,同时探讨了视频分割方法,如基于流向的马尔科夫假设分割框架。
摘要由CSDN通过智能技术生成

暑假听了computer vision的一个Summer School,里面Jason J. Corso讲了他们运用Low-Mid-High层次结构进行Video Understanding 和 Activity Recognition的方法,受益颇深,在这里把他的方法总结一下:




-------------------------------------------------------------------------------------------------

1. 层次结构表示:

  • 底层part 重用
  • 每个object都是一个由有向和无向边连接起来的混合图
  • 底层通过非线性学习让原子节点形成时空线、平面和区域

人的活动呢,就是这些object在中层和高层连接的混合图







-------------------------------------------------------------------------------------------------

2. Motion Perception——STS


Different action stimulate different subpopulation of cells.






-------------------------------------------------------------------------------------------------

3. Activity Recognition

Corso的方法:

  • Low-Level:底层最effective的做法是Bag of Features,特征为bottom-up / low level的时空特征,随着时间和层次不断update。通过模版进行底层object检测;
  • Mid-Level:中间层从images中检测、跟踪2D骨架pose,并通过背景内容分析动态pose;
  • High-Level:高层活动组合方法为,将不同时间点的feature组成时间-概率模型。时间上进行feature的时空跟踪,概率上根据组成语法进行概率模型的组合。
  • Recognition的另一种表示方法:
LSTM(长短期记忆)是一种深度学习模型,被广泛应用于许多人工智能任务中。人类活动识别也是一个需要使用LSTM模型的任务。人类活动识别是指从传感器中收集的数据中,识别人类的行为。这些行为可以包括步行、跑步、垂直行走、骑车等等。 使用LSTM模型进行人类活动识别的过程包括以下步骤:首先,收集人类活动的数据,例如加速度计和陀螺仪的读数。接下来,对数据进行预处理和特征提取,例如计算加速度计的幅值、频率和方向。然后,将提取的特征输入到LSTM模型中进行训练,以捕捉不同活动之间的动态模式。最后,使用训练好的模型来预测新数据中的人类活动。 LSTM模型在人类活动识别中的应用具有多方面的优势。首先,LSTM模型可以处理时序数据,例如一个人在不同时间执行的不同活动,因此比其他机器学习模型更适用于此类任务。其次,LSTM模型可以自适应地学习人类活动的动态模式,并在新数据上进行预测,因此可以获得更好的识别精度和鲁棒性。此外,LSTM模型可以处理多通道数据,例如加速度计和陀螺仪的读数,并从中提取更丰富的特征,从而提高人类活动识别的准确性。 总之,LSTM模型是一种非常流行的深度学习模型,被广泛用于人类活动识别中。它可以处理时序数据、自适应地学习人类活动的动态模式,并处理多通道数据,因此可以获得更好的识别精度和鲁棒性。
评论 39
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值