计算机视觉-运动的表达

最新推荐文章于 2021-08-24 13:28:37 发布

Better-1

最新推荐文章于 2021-08-24 13:28:37 发布

阅读量860

点赞数

分类专栏：计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/caihuanqia/article/details/106331577

版权

计算机视觉专栏收录该内容

18 篇文章 0 订阅

订阅专栏

运动的一般流程：

在这里插入图片描述

运动的表达

运动轨迹

能否正确表述物体运动状态的关键：
• 特征点的选取 • 轨迹的描述
1.直接按时间顺序连接相邻帧之间的特征点。
2.将特征点的集合逆合成不同的多项式曲线。
3.主曲线

运动轨迹的不足： • 只能粗略地表述物体全局的运动信息； • 无法描述运动细节； • 没有有效地体现时间信息。

时空图表达：
将图像序列的前景运动信息和时间信息用一张图表述。:运动能量图MEI、运动历史图MHI。。。

MEI：帧间差分，得到前景的二值图像，求并集。
缺点：做了相反的动作，仍得到相同的图像。

MHI：越接近当前帧越亮。

时空的分析：
•优点： • 较好地包含了全局运动、形状、时间信息。
•不足之处： • 缺少局部运动信息，不动有效地区分局部变化的动作； • 不动有效地区分速度的变化。

DNN的物体表达，每一层都是某一中表达，最后几层的表达更加有效。

在这里插入图片描述

稀疏、低秩表达

希望a中非零元素尽量少。
在这里插入图片描述

在这里插入图片描述

向量的零范数就是向量中0的个数。
在这里插入图片描述
1范数和0范数的解是一致的。

离测试样本的欧式距离最近的就是。
稀疏表达还是要根据任务来确定是否有效。

低秩表达：

松弛为合范数来表达。噪声
在这里插入图片描述
行为识别可以看作是时变特征数据的分类问题，即将待识别的行为序列（测试序列）与预先标记好的代表典型行为的参考序列进行匹配。

基于模板的匹配方法：

用输入图像序列提取的特征与在训练阶段预先保存好的模板进行相似性度量，选择与测试序列距离最小的已知模板的所属类别作为被测试序列的识别结果。

动态时间规整
是一种时变数据序列匹配方法，常用于微生物学中的DNA匹配、字符串和符号的比较以及语音分析等。

在这里插入图片描述
数据尺度的统一来保证图像的长度一样，才可以比较。

基于状态转移图模型的方法

基于状态转移图模型的方法定义每个静态姿势作为一个状态，这些状态之间通过某种概率联系起来。任何运动序列可以看作为这些静态姿势的不同状态之间的一次遍历过程，在这些遍历期间计算联合概率，其最大值被选择作为分类行为的标准。

常用于行为识别与理解的图模型方法有：  隐马尔可夫及其改进模型  动态贝叶斯网络  人工神经网络  有限状态机  置信网络


显马尔可夫：概率就是状态
隐马尔科夫：假设状态是晴天、阴天…
在这里插入图片描述在已经知道郊游、看电视等情况下来求得天气的情况就是隐马。(可以知道各种天气下做某些事的概率)

HMM的状态不可直接观测
可观察到的事件与状态并不是一一对应的确定性关系，而是通过一组概率分布相联系

HMM是一个双重随机过程，两个组成部分：
 马尔可夫链：描述状态的转移，用转移概率描述。
 一般随机过程：描述状态与观察序列间的关系，用观察概率描述。
在这里插入图片描述
估值问题：
待观测的策列：郊游、看电视、看电视(概率)
就是乘和加。

解码问题：
给定了模型参数和观测序列。
求解内部状态 S = q0,q1。。。。。S是最合理的。

训练问题

在这里插入图片描述

对于行为识别：
对于每个动作建立一个隐马模型：打拳，踢腿等等各自建立一个隐马。来一个新的同学，施展一个动作，然后就根据之前的隐马进行预测概率。

在这里插入图片描述

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。