基于LSTM构建运动模型的一篇文章
创新点:1.基于半监督热图训练主干网络
2.使用"one patch, multiple predictions"机制细化检测结果
3.使用LSTM构建运动模型(预测模型)
pipline:
具体LSTM的构建方法
LSTM输入向量为
网络通过一个线性层输入8D状态向量,然后是一个LSTM单元,最后是两个线性输出层,预测下一帧的位置和边界框大小
训练的trick:作者认为,完全使用带标签数据进行训练不利于长时序列建模,作者采取了一种动态调整的方式,设置一个参数p,p ( i )表示从第i个epoch的真值数据中采样输入的概率,1-p(i)表示从第i-1个epoch的预测数据中采样输入的概率。
将p初始化为一个较大的概率,通过公式来衰减