论文
- MIX: Multi-Channel Information Crossing for Text Matching
1. 概述
(1)MIX基于不同的粒度比较了文本片段,得到了一系列的多通道相似度矩阵,然后和一些精心设计的attention矩阵进行交叉,得到丰富的句子结构信息。
(2)MIX的基本思想总结为:
- MIX使用提取的多粒度特征,包括terms,phrases,syntax和semantics,term frequency和weights,甚至是语法信息,来表征文本片段。根据实验的结果来看,这些信息对于充分理解文章来说是至关重要的。
- MIX也提出了一种融合多通道信息生成匹配结果的新的融合技术。MIX中有两种类型的channel,一种是semantic信息通道,表示想unigrams,bigrams以及trigrams中的文本信息;第二种是像term weights,Part-of-Speech,Named Entities以及交互矩阵的空间相关度这样的,structure信息。
(3)在MIX中,semantic信息通道实现相似度匹配,structural信息通道作为attention矩阵。同时,MIX使用3D的CNN处理这些channel的堆叠矩阵。
2. 模型
(1)本文将两个句子见得匹配定义为global matching,将语句中文本要素的匹配定义为local matching。M