【专栏:前沿进展】机器翻译是自然语言处理领域最活跃、最充满希望的方向之一。机器翻译也从SMT(统计机器翻译)过渡到了NMT(神经机器翻译)的时代,深度学习的崛起也为主流范式注入了新希望。
作为技术变革的亲历者,东北大学自然语言处理实验室肖桐老师在访谈中表示「经历了从 SMT(统计机器翻译)到NMT的时代,我觉得很幸运,见证了机器翻译由发展到最终爆发的阶段,人们对机器翻译的关注度不断上升,很让人兴奋。」
经历了数年的增删打磨,2021年10月,《机器翻译:基础与模型》最终出版,洋洋洒洒600余页,90万字,这当中融汇了东北大学自然语言处理实验室和小牛翻译团队在这个方向上40余年的科研成果,凝聚着一代一代机器翻译学者的心血和思想。
与此同时,新时代背景下,问题也应运而生。大模型如何应用在机器翻译?通用模型如何应对细分领域的专用场景?另一方面,自媒体打出的「Facebook开源机器翻译新模型,同传人员或失业」等标题也为公众的认知蒙上了一层迷雾。
智源社区特此采访了本书的作者之一,东北大学自然语言处理实验室肖桐老师,通过10个问题解读了机器翻译近来的研究前沿和应用趋势,回顾机器翻译的前世今生。
肖桐,博士,东北大学教授、博士生导师,东北大学计算机学院人工智能系系主任,东北大学自然语言处理实验室主任,小牛翻译(NiuTrans)联合创始人。于东北大学计算机专业获得博士学位。2006-2009年赴日本富士施乐、微软亚洲研究院访问学习,并于2013-2014年赴英国剑桥大学开展博士后研究。主要研究领域包括自然语言处理、机器学习等。在国内外相关领域高水平会议及期刊上发表学术论文70余篇。作为项目技术负责人,成功研发了NiuTrans、NiuTensor等开源系统,在WMT、CCMT/CWMT、NTCIR等国内外测评中多次获得冠军。2014年获得中国中文信息学会首届优秀博士论文提名奖,2016年获得中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖。任ACL、EMNLP、TACL等国际著名会议及期刊的领域主席和常驻审稿人。
讲者:肖桐
编辑:李梦佳
Q1:机器翻译发展很长时间了,这种关注度提升背后的原因?
A:我认为,在近几十年内机器翻译应该是一个很受关注方向,它是自然语言处理包括整个人工智能领域中最重要最有挑战的一个任务,甚至有把它比喻成人工智能实现的终极目标之一,就是人工智能实现像图灵测试一样,机器翻译是其中一个终极目标。
近几年,随着报道和交流逐渐增多,人们对机器翻译的关注度也在提升。这归结于机器翻译的产业应用效果明显或者说技术落地变得更好了。换句话说,10年前的机器翻译虽然有技术有方法有论文,但是不好用。
但从整体技术范式的变迁来看,我觉得机器翻译发展到现在,以深度学习或神经机器翻译为主的这种范式,主要是技术量变到质变的过程。比如早期的机器翻译