涉及自然语言处理、人工智能、机器学习等诸多理论以及技术的顶级会议——第55届计算语言学年会(The 55th Annual Meeting of the Association for Computational Linguistics,简称 ACL 会议)于今年7月31日-8月4日在加拿大温哥华(Vancouver)举行。从近期谷歌学术(Google Scholar)公布的学术杂志和会议排名来看,ACL 依然是最重要的自然语言处理相关的人工智能会议。因为这个会议的涵盖面非常广泛,且理论文章较多,一般的读者很难从浩如烟海的文献中即刻抓取到有用信息,这里笔者从众多文章中精选出5篇有代表性的文章,为读者提供思路。
Multimodal Word Distributions
摘要:本文的核心思想为如何用 Gaussian Mixture Model 来对 Word Embedding 进行建模,从而可以学习文字的多重表达。这篇文章值得对 Text Mining
有兴趣的读者泛读。
文章作者 Ben Athiwaratkun 是康奈尔大学统计科学系的博士生。Andrew Gordon Wilson 是新加入康奈尔大学 Operation Research 以及 Information Engineering 的助理教授,之前在卡内基梅隆大学担任研究员,师从 Eric Xing 和
Alex Smola 教授,在之前,其在 University of Cambridge的Zoubin Ghahramani 手下攻读博士学位。
这篇文章主要研究 Word Embedding,其核心思想是想用 Gaussian Mixture Model 表示每一个 Word 的 Embedding。最早的自然语言处理