小米AI实验室多模态图片翻译论文入选自然语言处理领域顶级会议ACL 2023

小米AI实验室与厦门大学合作的多模态图片翻译研究入选ACL 2023,发布首个大规模真实场景数据集OCRMT30K,并提出基于多模态codebook的翻译模型,有效解决OCR错误传播问题,提升翻译准确性。该技术已应用于小米手机和IoT产品,如小爱翻译App,提供便捷的图片文本翻译功能。
摘要由CSDN通过智能技术生成

近日,ACL 2023的论文录用结果公布,小米AI实验室机器翻译团队联合厦门大学苏劲松教授团队在多模态图片翻译方向的最新研究成果已被ACL 2023主会录用,标志着小米在多模态机器翻译方向取得了重要进展。

ACL(Annual Meeting of the Association for Computational Linguistics)是自然语言处理(NLP)领域最重要的顶级国际会议之一。每年由国际计算语言学协会举办,是中国计算机学会(CCF)A类推荐会议。

40ef426080f310fd6eb01885f9934bbe.png

▍论文简介

题目:Exploring Better Text Image Translation with Multimodal Codebook

作者:蓝志彬,余嘉炜,李响,张文,栾剑,王斌,黄德根,苏劲松

类型:主会长文

一、研究背景

图片文本翻译(Text Image Translation,简称TIT)的目标是将图片中的源语言文本翻译成目标语言。它在旅游、外语学习、专业阅读、跨境电商等场景中具有重要的应用价值,已成为机器翻译产品的标配功能。

目前,TIT的研究面临两大主要瓶颈:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值