Lattice CNNs for Matching Based Chinese Question Answering

读论文记录,请多多指教。

Lattice CNNs for Matching Based Chinese Question Answering

摘要:两个短文本之间存在词不匹配以及表达多样性的问题,这对于中文来说,更加严峻。本文提出一种新的 基于lattice的CNN模型。在处理基于匹配的中文问答问题中,能够利用word-lattice中固有的多粒度信息,且具有很强的处理噪声的能力。 对基于文档的问答和基于知识的问答任务进行了广泛的实验,实验结果表明,LCNs模型可以提取word lattice中丰富且有差别的信息,性能优于其他。

介绍

在自然语言处理任务中,中文存在分词的困扰,当前也不存在一种适用于任何场景的分词方法。文本匹配通常需要获取两个句子之间多粒度的相关性。例如“Chinese people have high quality of life”的划分,其通常被划分为“chinese-citizen-life-quality-high",但若将其与"chinese-live-well"进行匹配,“Chinese-livelihood-live”的分词方式更好。
基于分布式表示可以概括传统词袋方法中离散词特征,现有工作使用神经网络模型来改善匹配。此外,还有融合词级和字符级信息的工作,在某种程度上可以缓解不同分段之间的不匹配,但是这些解决方法仍然受到原始词序结构的困扰。
对于基于文档的问答问题,匹配度反映对一个给定的问题,一个句子是他的回答的概率,问题和回答来源不同,因此会存在风格和句法结构都不同的问题。对于基于知识的问答,一个关键任务是对知识库的谓词短语来匹配问题的关系表达式。
图1

本篇论文提出一种多粒度的方法用于中文问答中的短文本匹配,该方法利用lattice CNNs从word lattice中提取句子级的特征。LCNs不依赖单词或字符级的序列,将word lattice作为输入,所有可能的单词和字符都同等对待,且具有他们各自的上下文,从而可以在每一层进行交互。对于每一层的每个单词,LCNs能够通过池化的方法以不同的粒度捕捉其不同的上下文单词。

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值