AR-HMM模型 自回归隐马尔可夫模型
数据处理过程
输入的视频数据首先需要被裁剪以适合动物的大小,在这之后考虑到模型建立的目的为行为状态的分类,于是需要消除可能一帧里带有多个动作状态的行为成分,这个过程也就是对帧。对帧之后我们的为了适应模型训练还需要对每一帧的数据进行小波分解(类似傅里叶变换的信号重构),此时数据预处理阶段完成。
信号重构后的数据拥有的特征维度过多,因此需要应用主成分分析法(PCA)来选出对于分类结果贡献度最高的前十个分类特征。至此自回归隐马尔可夫模型的准备工作就完成了。
AR-HMM自回归隐马尔可夫模型
为了更好的理解AR-HMM模型,本文将从一下三个方面进行解释
1.马尔可夫过程
2.隐马尔可夫模型HMM
3.自回归模型AR
1.马尔可夫过程
现状可以控制过渡到下一状态的概率:在已知它所处的状态的条件下,它未来的演变不依赖于它以往的演变。即已知现在的条件下,将来与过去是互相独立的
以文中小鼠行为状态分类为例:小鼠在下一帧里的运动状态只能取决于其前一帧的运动状态(转弯时的连续动作)
至此,不难看出,马尔可夫过程是与时间序列高度相关的一个决策过程。
2.隐马尔可夫过程HMM
参考刚刚的马尔可夫过程,HMM可以被简单的理解为有关时间序列的概率模型。其描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列,再由各个状态生成一个观测而产生观测随机序列的过程。隐藏的马尔可夫链随机生成不可观测的状态的序列称为状态序列;每个状态生成一个观测,再由此产生的观测的随机序列,称为观测序列。序列的每一个位置可以看作是一个时刻。
以文中小鼠行为状态分类为例:小鼠的行为状态的分类标签就可被看作状态序列,而每一帧下小鼠的运动状态可被看作观测序列,每一帧数就是一个时刻。
隐马尔可夫模型由初始概率分布、状态转移概率分布、观测概率分布确定。
初始概率分布π
初始概率分布可以理解为初始条件下小鼠被分类为不同行为状态的概率分布
状态转移概率分布A
状态转移概率分布A可以理解为在同一时刻下小鼠从一个行为状态向另一个行为状态转移的概率
观测概率分布B
观测概率分布分布B可以理解为在特定时刻下,小鼠被分类为不同行为状态的概率(此时的初识概率分布可能由于大量数据的加入而产生变化)
3.自回归模型AR
与HMM一样,AR也是一个基于时间序列的模型,AR可以用统计量来计算输出变量与不同时滞下的前一时刻的值之间的相关性。输出变量与特定滞后变量的相关性越强,自回归模型在建模时对该变量的权重越大。
换言之,AR也是一个根据上一步动作来预测下一步动作的模型,除此之外,AR还可以通过选择相关性强的滞后变量来达到补充HMM模型缺少的关键参数(A,B,π)这一目的,最终达到分类小鼠行为状态的模型建立目标。