贴一下汇总贴:论文阅读记录
论文链接:《Time-Aware Ancient Chinese Text Translation and Inference》
一、摘要
在本文中,我们旨在解决围绕中国古代文本翻译的挑战:(1)由于时代差异导致的语言差异导致翻译质量不佳,以及(2)大多数翻译缺少上下文信息这对于理解文本通常非常重要。为此,我们通过提出以下建议来改进过去的翻译技术:我们将任务重新构建为多标签预测任务,其中模型预测翻译及其特定时代。我们观察到这有助于弥合语言鸿沟,因为时间顺序上下文也被用作辅助信息。% 作为泛化的自然步骤,我们以现代中文翻译为中心来生成多语言输出。我们通过实验展示了我们的框架在生成高质量翻译输出方面的功效,并在收集的特定于任务的平行语料库上验证了我们的框架。我们在一个用年表信息注释的平行语料库上验证了我们的框架,并通过实验证明了它在产生高质量翻译输出方面的功效。我们同时发布代码和数据以供将来研究:github。
二、结论
在这篇论文中,我们提出了一个框架,在低资源场景下,用很少的并行数据和大量没有古今对齐信息的非平行句子,将古代汉语文本翻译成现代对应。我们展示了年代推断作为一项辅助任务的重要性和有用性,它暗示了潜在的历时语义空白。我们希望扩展这项研究,以