论文信息
题目:Understand Layout and Translate Text: Unified Feature-Conductive End-to-End Document Image Translation
理解布局并翻译文本:统一特征传导的端到端文档图像翻译
作者:Zhiyang Zhang, Yaping Zhang, Yupu Liang, Cong Ma, Lu Xiang, Yang Zhao, Yu Zhou, and Chengqing Zong
论文创新点
- 提出统一特征传导框架UniDIT:论文提出了名为UniDIT的统一文档图像翻译框架,该框架基于“理解布局→翻译文本”的流程,明确将几何布局和逻辑布局纳入文档图像翻译过程。
- 引入布局桥接模块&#x