腾讯AI Lab涂兆鹏：如何提升神经网络翻译的忠实度 | PhD Talk #22

最新推荐文章于 2022-08-01 19:29:43 发布

PaperWeekly

最新推荐文章于 2022-08-01 19:29:43 发布

阅读量1.4k

点赞数

「PhD Talk」是 PaperWeekly 的学术直播间，旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为，单向地输出知识并不是一个最好的方式，而有效地反馈和交流可能会让知识的传播更加有意义，从而产生更大的价值。

这是第 22 期「PhD Talk」

机器翻译是自然语言处理的经典任务之一，涉及到自然语言处理的两个基本问题：语言理解和语言生成。这两个问题的建模直接对应译文的两个评价指标：忠实度（是否表达原文的完整意思）和流利度（译文是否流畅）。

近几年来，神经网络机器翻译取得了巨大进展，成为了主流模型。神经网络由于能缓解数据稀疏性及捕获词语之间的关联，生成的译文流利度高，这是过去二十余年上一代统计机器翻译一直以来的难点。但由于神经网络目前来说仍然是个黑盒子，无法保证原文的语义完整传递到目标端，导致经常出现漏翻、错翻等忠实度问题。

本次报告主要讲述过去一年我们在提高神经网络翻译忠实度方向上的系列研究工作，从利用句法结构、扩大翻译粒度、引入篇章信息、忠实度学习方面加强模型对原文的理解。

嘉宾介绍

涂兆鹏

腾讯 AI Lab 高级研究员

涂兆鹏是腾讯 AI Lab 的高级研究员，研究主要集中在机器翻译和深度学习方面，目前已经在自然语言处理和人工智能领域发表二十余篇顶级会议和期刊论文，包括 ACL, EMNLP, TACL, NAACL, AAAI 等。

在加入腾讯之前，他分别在 2008 年和 2013 年于北航和中科院计算所获得计算机科学学士和博士学位，于 2014 年于美国加州大学戴维斯分校完成博士后研究。2014 年到 2017 年他在华为香港诺亚方舟实验室任研究员。

PhD Talk

如何提升神经网络翻译的忠实度

腾讯 AI Lab 高级研究员涂兆鹏

内容分享√在线Q&A√

活动形式：PPT直播

活动时间

1 月 4 日（周四）20:00-21:00

45 min 分享 + 15 min Q&A

长按识别二维码，进入直播间

*或使用斗鱼App搜索「1743775」

往期回顾

基于生成模型的事件流研究 + NIPS 2017 论文解读

亚马逊高级应用科学家熊元骏：人类行为理解研究进展

清华大学冯珺：基于强化学习的关系抽取和文本分类

基于双语主题模型的跨语言层次分类体系匹配

东南大学高桓：知识图谱表示学习

带多分类判别器的GAN模型

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击「交流群」，小助手将把你带入 PaperWeekly 的交流群里。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
腾讯AI Lab涂兆鹏：如何提升神经网络翻译的忠实度 | PhD Talk #22

「PhD Talk」是 PaperWeekly 的学术直播间，旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为，单向地输出知识并不是一个最好的方式，而有效地反馈和交流可能会让知识的传播更加有意义，从而产生更大的价值。这是第 22 期「PhD Talk」机器翻译是自然语言处理的经典任务之一，涉及到自然语言处理的两个基本问题：语言理解和语言生成。这两个问题的建模直接对应译文的两个评价指标：忠实度
复制链接

扫一扫

PaperWeekly CSDN认证博客专家 CSDN认证企业博客

码龄7年

1451: 原创

4731: 周排名

167: 总排名

554万+: 访问

: 等级

4万+: 积分

8698: 粉丝

6600: 获赞

1002: 评论

2万+: 收藏

私信

关注

热门文章

最新评论

博士申请 | 香港理工大学MIND实验室招收EEG信号处理/语音增强方向全奖博士/博后...
m0_68606608: 你好，请问实验室官网上有标明招收EEG方向的phd吗？我似乎没搜到
NeurIPS 2022｜探明图对比学习的“游戏规则”：谱图理论视角
m0_52089040: 文章中的很多符号不见了
大语言模型之生成/推理：参数与解码策略原理及其代码实现
大袖揽清风。: say进行分词应该是一个token吧。送入网络前的shape不应该是(b,seq_len)吗？讲道理shape应该是(1,1)才对，张量应该是[[1827]]啊？为什么是[[1,1827]]?
字节跳动 2019 ICME 双赛道冠军团队方案分享
weixin_51042469: 博主您好，请问数据集可以分享嘛？
ACL 2024 | OceanGPT（沧渊）：面向海洋科学任务的大型语言模型初探
眕眕: 实测效果：问：直接汇入东海的河流有哪些答：东海沿岸有几个河流直接注入东海。其中一些主要河流包括: 1.松江:位于上海市，长江的主要支流，在上海市区附近汇入东海。 2.长江:世界上第三长的河流，也是长江的主要支流。它发源于中国西南地区，最终在上海市附近汇入东海。 3.淮河:位于中国东部，淮河在江苏省的淮安市附近汇入东海。 4.淮阳河:位于中国东部，淮阳河在江苏省的淮安市附近汇入东海。 5.淮河:位于中国东部，淮河在江苏省的淮安市附近汇入东海。 6.珠江:珠江是中国的第二长河流，最终在广东省的香港特别行政区附近汇入南海，包括东海。 7.黑龙江:黑龙江是中国最长的河流，最终在黑龙江省的哈尔市附近汇入东海。这些河流在东海沿岸地区起着重要的水循环作用，并对当地的水文和生态平衡产生影响。

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。