论文笔记整理:谭亦鸣,东南大学博士。
来源:TACL 2020
链接:
https://arxiv.org/ftp/arxiv/papers/2003/2003.01343.pdf
1.背景介绍
跨语言实体链接(Cross-lingual Entity Linking, XEL)旨在利用源语言文本中实体描述(提及),从目标语言的知识库中获取对应的参照实体,其解决方法一般分为两个步骤:1.候选生成;2.实体挑选。这一任务在富资源场景下(如Wikipeida)取得了不错的研究成果,但是并没有很好的扩展到低资源语言上(Low-resource Language, LRL)。虽然近期利用迁移学习的工作通过利用相关语言资源能够一定程度上缓解LRL对资源的需求,但是其实验性能依旧远逊于富资源的XEL模型。
其中一个主要原因是,跨语言的实体链接无法像单语那样使用序列匹配的方式解决候选生成问题,虽然Wikipedia提供了inter language links这样的多语言实体对齐资源,具有一定可扩展的潜力,但是现阶段的工作依然表现不佳。也有一些工作提出利用翻译模型生成LRL的英文实体,或者基于实体词典训练跨语言的序列匹