数据序列分类是数据科学中一个重要且具有挑战性的问题。在许多应用中,都有实际需要,通过找到输入中导致算法做出某些决策的判别部分来解释分类决策。卷积神经网络在数据序列分类任务中表现良好;然而,这类算法对于多元数据序列这一特定情况的解释性较差。解决这个重要的限制是一个重大的挑战。本文提出一种新的方法,通过同时突出时间和维度的判别信息来解决这个问题。本文的贡献是双重的:首先描述了一种能够比较维度的卷积架构;提出一种返回dCAM的方法,dCAM是专门为多元时间序列(和基于cnn的模型)设计的维度类激活图。在多个合成数据集和真实数据集上的实验表明,dCAM不仅比以往的方法更准确,而且是多元时间序列中判别性特征发现和分类解释的唯一可行解决方案。
阅读者总结:这篇论文将CAM这个模型改换到多维时间序列上,对重要的分类特征实现可解释性。可以理解为提取多元时间序列上每个维度的特征,然后进行融合,再提取特征。在技术处理和模型设计上没有感觉焕然一新,比如深度学习里利用attention机制实现可解释性。
方法:
本文提出了一种新方法,通过解决基于cnn的流行模型的这一限制来填补空白。本文提出一种新的数据组织和一种新的CAM技术,dCAM(维度类激活图),能够同时突出时间和维度信息。例如,在图1中,dCAM(底部热图)指向特定维度的特定子序列,解释了为什么两种手势不同。该方法只需要一个训练阶段,不受架构类型的限制,并且可以高效有效地检索可判别特征,这得益于一种利用来自输入数据维度不同排列的信息的技术。因此,我们可以应用CAM的任何类型的架构都可以从我们的方法中受益
图3描述了dCNN架构。输入C(T)被转发到一个经典的二维CNN。体系结构的其余部分独立于输入数据结构。后者意味着可以使用任何其他二维架构(包含全局平均池化)(如ResNet),只需调整输入数据结构。同样,训练过程也可以由用户自由选择。在本文的其余部分,我们将使用交叉熵损失函数和ADAM优化器。
Dimension-wise Class Activation Map
1)Random Permutation Computations.
Merging Permutations
dCAM Extraction.
实验跳过.................................