机器翻译是自然语言处理的经典任务之一,涉及到自然语言处理的两个基本问题:语言理解和语言生成。这两个问题的建模直接对应译文的两个评价指标:忠实度(是否表达原文的完整意思)和流利度(译文是否流畅)。
近几年来,神经网络机器翻译取得了巨大进展,成为了主流模型。神经网络由于能缓解数据稀疏性及捕获词语之间的关联,生成的译文流利度高,这是过去二十余年上一代统计机器翻译一直以来的难点。但由于神经网络目前来说仍然是个黑盒子,无法保证原文的语义完整传递到目标端,导致经常出现漏翻、错翻等忠实度问题。
本次报告主要讲述过去一年我们在提高神经网络翻译忠实度方向上的系列研究工作,从利用句法结构、扩大翻译粒度、引入篇章信息、忠实度学习方面加强模型对原文的理解。
嘉宾介绍
涂兆鹏
腾讯 AI Lab 高级研究员
涂兆鹏是腾讯 AI Lab 的高级研究员,研究主要集中在机器翻译和深度学习方面,目前已经在自然语言处理和人工智能领域发表二十余篇顶级会议和期刊论文,包括 ACL, EMNLP, TACL, NAACL, AAAI 等。
在加入腾讯之前,他分别在 2008 年和 2013 年于北航和中科院计算所获得计算机科学学士和博士学位,于 2014 年于美国加州大学戴维斯分校完成博士后研究。2014 年到 2017 年他在华为香港诺亚方舟实验室任研究员。
PhD Talk
如何提升神经网络翻译的忠实度
腾讯 AI Lab 高级研究员涂兆鹏
内容分享√在线Q&A√
活动形式:PPT直播
活动时间
1 月 4 日(周四)20:00-21:00
45 min 分享 + 15 min Q&A
长按识别二维码,进入直播间
*或使用斗鱼App搜索「1743775」
![](https://i-blog.csdnimg.cn/blog_migrate/b387b6303b2c6dcf39b942b4946b5e80.png)
往期回顾
关于PaperWeekly
PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。