原文《Fusing Geometric Features for Skeleton-Based Action Recognition using Multilayer LSTM
Networks》
尽量避免两个流之间有信息交换,每个流应该有自己softmax和loss层。
之前流行的方法是每个feature分配平均的权重,但是不同的feature对最终的预测结果有不同的贡献,所以他们之间的权重应该不同
三种普遍融合方法比较
输入层融合,全连接融合,最后平均score融合
smoothed score
最终采用的融合方法,N是模型的个数,T是一个尺度因子,