论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识库问答。
来源:WWW2019
链接:https://dl.acm.org/citation.cfm?doid=3308558.3313502
本文提出了一种面向cQA的跨语言问题检索方法,旨在对于给定的问题检索出其对应另一目标语言的相似问题或查询。这个任务(跨语言信息检索)的常规做法是:1.将给定问题翻译为目标语言;2.应用单语信息检索方法完成查询。这种做法的缺陷在于翻译可能存在错误,并传递到之后的检索过程。针对这一缺陷,作者基于上述方法提出改进:1.利用单语cQA数据提升翻译质量;2.在现有的神经信息检索模型的训练过程添加译回机制(back-translation),提升模型的鲁棒性。
贡献
本文贡献包括以下几点:
1. 研究了technical cQA上的跨语言问题检索方法,并发现翻译质量是严重影响检索