【论文阅读笔记】Analyzing and Interpreting Convolutional Neural Networks in NLP

本文发布在arxiv 2018。

        卷积神经网络已成功应用于各种NLP任务。然而,CNN是否对不同的语言模式进行不同建模(如否定,语气强度和复合句子)以帮助决策并不清楚。在本文中,通过应用可视化技术来观察模型如何捕获不同的语言特征以及这些特征如何影响模型的性能。文章还尝试识别模型错误及其来源。先前的研究主要采用saliency scores,saliency heat maps 方式进行可视化,这种方式通过计算saliency scores相对于词嵌入的一阶导数来衡量tokens对最终决策的贡献程度,但由于saliency scores是在所有特征图的基础上计算得到,这种方法不能得到如步长、卷积核大小之类的参数对模型的影响。本文提出一种简单的方法:利用过滤器对词嵌入应用卷积生成的特征映射,单词和短语由其在不同特征图图中的卷积值表示,为了用单个向量表示短语或句子,使用特征映图中的最大卷积值来代替。如下图:

         

       文章中对saliency score和convolution values方法进行了比较,可以看出效果差不多,每个单词在CNN中不同filter中关注的程度近似相同,但本文的方法比较简单。

'

文章中还对不同的网络参数进行了可视化:

 

        用单卷积层,卷积核大小为1,步长100的CNN在 Stanford Sentiment Treebank (STT),The Subjectivity Dataset进行了以下几个维度的可视化分析:

1.Dominant Groups of Tokens

对于情感分析人物,副词和形容词对最终决策影响最大,在具体主客观人物中,代词影响最大。

2.Contrast and Negation

可视化中可以看到正反语句的权重有明显不同

 

3.Intensity

语气强弱程度的不同可视化结果。

 4.Compositionality

 最有趣的是最后一部分的错误分析,从CNN错分的语句中总结出错分的特点,用于指导CNN的改进。

 

      从错分的原因中看,最大的错误来源于隐喻,人能正确识别,但CNN无法正常识别,才说明CNN做NLP对词义的理解比较表层。其次就是 CNN捕捉句子中长时间依赖的为题,增加kernel Size能改善CNN性能,但是大的卷积核也会导致模型失效。第三种错误就一词多义导致的错误,CNN还很难对一词多以 进行理解。第四大类的错误原因就是token不平衡导致。总体说来,CNN工作只是做比较浅层的语义分析,还不能想人一样深入语句内部提取词义,这些都是CNN用于NLP领域值得探究的地方。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
分析神经时间序列数据是指通过对大脑神经活动的电信号数据进行处理和解读,以了解大脑的工作机制和功能。神经时间序列数据通常是通过脑电图(EEG)、脑磁图(MEG)、功能磁共振成像(fMRI)等技术获取。 在分析神经时间序列数据时,首先需要对数据进行预处理。这包括数据清洗(去除噪声)、滤波(提取感兴趣的频率带)、降采样等步骤。 接下来,可以通过不同的分析方法来研究神经数据。一种常见的方法是事件相关电位(ERP)分析,它可以用来检测特定刺激或事件引发的大脑电信号变化。另一种方法是时频分析,它可以揭示出不同频率分量在时间上的变化,可以帮助我们理解不同的认知过程。 此外,还有一些高级的分析方法可以用于处理神经时间序列数据。例如,独立成分分析(ICA)可以通过对数据进行分解,找出不同的独立成分,并帮助我们分辨出不同的脑区活动。另一个例子是相干性分析,可以用于研究不同脑区之间的功能连接。 最后,通过将神经时间序列数据与行为数据或临床数据进行关联分析,我们可以进一步了解大脑活动与行为或疾病之间的关系。 总而言之,分析神经时间序列数据是一个复杂而关键的过程,通过合理的预处理和选择合适的分析方法,我们可以从这些数据中获得对大脑功能和认知过程的更深入理解,并为神经科学研究和临床应用提供重要指导。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值