哈工深、微信：“慢思考”超长文档翻译智能体-CSDN博客

本文链接：https://blog.csdn.net/qq_27590277/article/details/143170248

如今，大语言模型已经成为机器翻译任务（Machine Translation）上的新型强大工具。然而，多数在机器翻译大语言模型（MT-LLM）上开展的研究工作都是句子层面的，每一句话都被独立进行翻译，从而忽视了在翻译文档翻译（Document-Level）场景下句子间可能存在的逻辑关系。

此外，大语言模型在推理框架中是一个独立、封闭的个体，仅能被动地接收外部输入的信息并进行处理，同时还具有上下文容量上的局限性，因此难以胜任诸如长文本处理、文档翻译之类的复杂任务。

今天介绍的论文来自哈尔滨工业大学（深圳）计算与智能研究院和腾讯WeChat AI。这篇论文提出了一种名为DelTA（Document-levEL Translation Agent）的基于多级记忆组件的文档翻译智能体。 DelTA通过使用专有名词记录、双语摘要和长短时记忆等多级记忆机制，对文档中不同范围、不同粒度及不同形式下的关键信息进行提取、存储和检索，以辅助翻译过程的进行。这种创新架构不仅能够提升文档翻译的质量，还能够显著改善翻译结果的上下文一致性，以及避免大语言模型在翻译整篇文档时可能造成的句子漏译现象。

论文标题：DelTA: An Online Document-Level Translation Agent Based on Multi-Level Memory
论文地址：https://arxiv.org/abs/2410.08143
代码地址：https://github.com/YutongWang1216/DocMTAgent