Lattice CNNs for Matching Based Chinese Question Answering

最新推荐文章于 2020-10-14 21:16:10 发布

VIP文章 lwz1120

最新推荐文章于 2020-10-14 21:16:10 发布

阅读量1.5k

点赞数 2

分类专栏：读论文

本文链接：https://blog.csdn.net/weixin_40341844/article/details/101767163

版权

读论文记录，请多多指教。

Lattice CNNs for Matching Based Chinese Question Answering

摘要：两个短文本之间存在词不匹配以及表达多样性的问题，这对于中文来说，更加严峻。本文提出一种新的 基于lattice的CNN模型。在处理基于匹配的中文问答问题中，能够利用word-lattice中固有的多粒度信息，且具有很强的处理噪声的能力。对基于文档的问答和基于知识的问答任务进行了广泛的实验，实验结果表明，LCNs模型可以提取word lattice中丰富且有差别的信息，性能优于其他。

介绍

在自然语言处理任务中，中文存在分词的困扰，当前也不存在一种适用于任何场景的分词方法。文本匹配通常需要获取两个句子之间多粒度的相关性。例如“Chinese people have high quality of life”的划分，其通常被划分为“chinese-citizen-life-quality-high"，但若将其与"chinese-live-well"进行匹配，“Chinese-livelihood-live”的分词方式更好。
基于分布式表示可以概括传统词袋方法中离散词特征，现有工作使用神经网络模型来改善匹配。此外，还有融合词级和字符级信息的工作，在某种程度上可以缓解不同分段之间的不匹配，但是这些解决方法仍然受到原始词序结构的困扰。
对于基于文档的问答问题，匹配度反映对一个给定的问题，一个句子是他的回答的概率，问题和回答来源不同，因此会存在风格和句法结构都不同的问题。对于基于知识的问答，一个关键任务是对知识库的谓词短语来匹配问题的关系表达式。

本篇论文提出一种多粒度的方法用于中文问答中的短文本匹配，该方法利用lattice CNNs从word lattice中提取句子级的特征。LCNs不依赖单词或字符级的序列，将word lattice作为输入，所有可能的单词和字符都同等对待，且具有他们各自的上下文，从而可以在每一层进行交互。对于每一层的每个单词，LCNs能够通过池化的方法以不同的粒度捕捉其不同的上下文单词。

最低0.47元/天解锁文章

lwz1120

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
5
评论
Lattice CNNs for Matching Based Chinese Question Answering

读论文记录，请多多指教。Lattice CNNs for Matching Based Chinese Question Answering摘要：两个短文本之间存在词不匹配以及表达多样性的问题，这对于中文来说，更加严峻。本文提出一种新的基于lattice的CNN模型。在处理基于匹配的中文问答问题中，能够利用word-lattice中固有的多粒度信息，且具有很强的处理噪声的能力。对基于文档的...
复制链接

扫一扫