雷锋网(公众号:雷锋网)AI科技评论按:计算机语言学和自然语言处理最顶尖的会议之一ACL 将于2017年7月30日至8月4日在加拿大温哥华举行。雷锋网AI科技评论将赴前线带来一手报道,并对论文及大会概况进行梳理。
今年的ACL邀请到了两位重量级嘉宾进行invited talk,下面是雷锋网对演讲简介的编译,Noah Smith将会讨论目前表征学习所面对的挑战,Mirelaa Lapate将会介绍多模式翻译。
详解计算语言学(Squashing Computational Linguistics)
Noah Smith(华盛顿大学)
以下是官网提供的演讲内容简介:
表征学习是计算语言学和自然语言处理领域目前最炙手可热的方法。与出席这次会议的其他人一样,我将介绍在自然语言模型中使用表征学习的新方法。由于一个数据驱动的模型通常需要一个假定的理论(并不一定是最好的理论),我会论证语言的representation-learning-infused模型的language-appropriate inductive bias的优点。这种偏差通常以假设的形式被引入到模型中、对推理算法的限制条件中、或者数据的语言分析中。事实上,语言学研究的这几十年(包含计算语言学),使得我们这个领域处于辨别可行的inductive bias的优势位置。新的模型又可以让我们去探索先前不可获得的偏差形式,并产生新的语言学发现。我将着重于新的文档和句子语义结构,并强调抽象的,可复用的组成部分和它们的假设,而并不将重点放在应用上。
演讲者简介:Noah Smith是华盛顿大学计算机科学与工程系的Paul G. Allen学院的副教授。此前,他曾在卡内基梅隆大学计算机科学学院任副教授。Noah Smith在约翰霍普金斯大学计算机科学系获得博士学位,在马里兰大学获得计算机科学学士学位以及语言学学士学位。他的研究横跨包括自然语言处理,机器学习和计算机社会科学在内的许多话题。他曾任CL,JAIR和TACL编辑,以及SIGDAT的财务主管,并作为2016年ACL会议的程序联合主席。他的研究小组:诺亚方舟,是自然语言处理学术上和工业界中的世界级领导者。Smith的工作得到了UW Innovation Award, Finmeccanica career development chair at CMU,NSF CAREER Award,Hertz Foundation graduate fellowship的认可,并获得了无数的最佳论文奖,曾被NPR、BBC、CBC、纽约时报、华盛顿邮报和Time杂志报导。
多模式与文本的相互翻译(Translating from Multiple Modalities to Text and Back)
Mirella Lapata(爱丁堡大学)
近年来,研究者们开发了很多计算工具来处理和生成自然语言文本。其中许多工具对于主流计算机用户来说已经很熟悉了,它们多被应用在网络搜索,问答,情绪分析,特别是机器翻译中。机器翻译的应用不仅可以在不同语言之间(例如英语到法语),还可以应用在相同国语言之间,在不同的模式之间或不同的数据格式之间进行翻译(比如视频或图像翻译为文本),这可以进一步增强网络的可访问性。这是由于网络中大多数据都是非语言数据(例如视频,图像,源代码),而大多数检索工具只能对文本数据进行操作,因此大多数数据都不能够被索引或搜索。
在这个演讲中,Lapata 教授会论证为了使个人和计算机的电子数据更易于访问,需要开发新的翻译模型。我将重点介绍三个示例:文本简化,源代码生成和电影摘要。其次,他将描述关于深度学习拓展的最新进展,以引出不同模式的一般性表示,并学习如何在这些模式和自然语言中进行翻译。
演讲者简介:Mirella Lapate是爱丁堡大学信息学院的自然语言处理教授。她的研究重点是让电脑学会理解,推理,以及生成。她是Journal of Artificial Intelligence Research的副主编,曾在ACL和Computational Linguistic委员会任职。她是英国计算机学会Karen Sparck Jones奖的第一个获奖者。她获得过两次EMNLP最佳论文奖,目前持有欧洲研究理事会著名的Consolidator Grant。
本文作者:高云河
本文转自雷锋网禁止二次转载,原文链接