Word Embedding News|词嵌入新鲜事:六月刊:GPT-3来了

本文是WEN(词嵌入新闻)的六月刊,重点关注ACL 2020的词嵌入趋势、GPT-3的发布及其技术、商业影响。尽管GPT-3在技术上取得突破,但在商业应用上仍处于初期阶段。此外,还讨论了AI2的跨语言词嵌入播客,强调了多语种语境词嵌入的研究价值。
摘要由CSDN通过智能技术生成

这里是 WEN(Word Embedding News)|词嵌入新鲜事。

作为起步,它将基于 Sebastian Ruder NLP News 的每月筛选,聚焦词嵌入领域。对涉及内容在本人阅读后的基础上进行总结、评论。不简单复制,力求做到小而精。

关于作者:张正,坐标巴黎,上班NLP,下班词嵌入。

没想到词嵌入新鲜事第二期就要改变起步策略:之前说“它将基于 Sebastian Ruder NLP News [6] 的筛选,聚焦词嵌入领域”,结果前脚说完,Sebastian 就在最新一期 NLP News 中说:

Overall, I’ve realized that trying to provide a comprehensive mix of everything that has been going on is not sustainable for me. So I’ll try to refocus ‍with this newsletter and to prioritize covering fewer things in-depth.

非常理解他的选择,一个人想要紧跟 NLP 各个领域的最新发展,对时间和精力都是巨大的挑战,专注于某几个领域对个人来说是更好的选择。

这件事对词嵌入新鲜事的直接影响是,我不能再从这单一信息源做筛选深挖了。塞翁失马,焉知非福,我一方面“被迫”需要搜集阅读更多的信息源、一方面对内容的选择编排有了更大的自主性。希望一步一步不断学习、优化,做得更好。

好了,下面是词嵌入新鲜事 2020 六月刊。

6 月里最最最重要的新鲜事是 MOJITO。除此之外,词嵌入领域,本期重点关注三个组织:

  • ACL:词嵌入研究趋势

  • OpenAI:GPT3 来了

  • AI2:NLP Highlights 推荐


ACL 2020 之词嵌入研究趋势

ACL 2020 发榜不久,官方于 6 月 4 日公布了相关统计数据。

https://acl2020.org/blog/general-conference-statistics/

单看数据,词嵌入研究工作通常所属的 Semantics: Lexical 中稿率与 Discourse and Pragmatics 并列倒数第一,17.9%,远低于 22.7% 的总平均值。

如果再搭配 Trends of ACL 的动态图,观察 word-level semantics 变化趋势,打击倍增。

https://public.flourish.studio/visualisation/2431551/?utm_campaign=NLP%20News&utm_medium=email&utm_source=Revue%20newsletter

当然,Semantics:Lexical 并不直接等同于词嵌入研究,随着 word embedding 在 NLP 中的广泛应用,及 language modelling 对词嵌入研究方向的推动,我们这里宽泛意义上的“词嵌入研究”越来越多地存在于不同的 track 中。

比如,在 ACL 2020 词嵌入长文汇总分类中,仅长文就 37 篇,远多于 Semantics:Lexcial 总录取数 17 篇。

GPT 之野望ÿ

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值