摘要
文本蕴含识别旨在自动判断给定的前提和假设(通常为2个句子)之间是否存在蕴含关系,是自然语言处理领域一项基础但富有挑战的任务.当前,主流的基于深度学习的模型通常分别建模前提和假设的语义表示,而没有把它们看作一个整体;另外,在捕获它们之间的语义关系时,大都没有同时利用句子级别的全局信息和短语级别的局部信息.最近提出的S-LSTM 能够同时学习句子和短语的语义表示,在文本分类等任务上取得了较好的效果.基于上述情况,提出了一种基于扩展的S-LSTM 的文本蕴含识别模型.一方面,把前提和假设看作一个整体,扩展S-LSTM 以同时学习它们的语义表示;另一方面,在建模语义关系时,既利用句子级别的信息又利用短语级别的信息,以此获得更好的语义表示.在 英 文SNLI数据集和中文CNLI数据集上的实验结果表明:提出的模型取得了比基准模型更好的识别性能.
模型
总结
本文提出了一种基于扩展 的 S-LSTM 的 文 本蕴含识别模型.具体地,从编码层中前提和假设的信息交换的建模、交互层中句子级别的全局语义的利用这2个方面对前人的工作进行改进.所 提 模 型 在文 SNLI和 中 文 CNLI数 据 集 上,都 取 得 了 同 类方法中较好的识别性能.在未来的工作中,我们将探索把扩展的S-LSTM 用于其他句子对相关的任务,如隐式篇章关系识别、复述识别等.