【文本表征】2018年自然语言理解最火的三种方法

最新推荐文章于 2024-04-18 15:53:00 发布

王小小小草

最新推荐文章于 2024-04-18 15:53:00 发布

阅读量1.5k

点赞数

分类专栏： NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_33761963/article/details/88087558

版权

众所皆知的分布式词向量方法CBOM, skip-gram, Glove等已经成为NLP任务的标配，但致命的缺点是无法区别同一个词在不同语境下的含义，如“bank"无论是银行还是河岸的意思，词向量都是同一个，让人脑壳疼。本文要介绍的是2018年很火的三个方法：Elmo, GPT, BERT。它们能够处理多义词、反应不同的语境，从而更好地理解自然语言，并且在下游NLP任务中有突出表现。1 ELMO...

摘要由CSDN通过智能技术生成

众所皆知的分布式词向量方法CBOM, skip-gram, Glove等已经成为NLP任务的标配，但致命的缺点是无法区别同一个词在不同语境下的含义，如“bank"无论是银行还是河岸的意思，词向量都是同一个，让人脑壳疼。本文要介绍的是2018年很火的三个方法：Elmo, GPT, BERT。它们能够处理多义词、反应不同的语境，从而更好地理解自然语言，并且在下游NLP任务中有突出表现。

1 ELMO

来自论文：“Deep contextualized word representation（2018.3）”
机构：Allen Institute for Artificial Intelligence

概述：文章提出ELMO模型，在大量的语料上训练一个深层双向语言模型，输入为一个完整的句子，句子中的词向量的表征由该模型隐层的函数表示。

1.1 基础：双向语言模型

前向语言模型是用前面的词去预测下一个词：
image_1d0lc84cejta1pjessr153c1d539.png-6.6kB
句子中的词被映射到词向量之后，依次输入L层RNN，将该词在第L层输出的隐藏向量输入softmax去预测下一个词。

后向语言模型是用后面的词去预测前�一个词：

最低0.47元/天解锁文章

王小小小草

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【文本表征】2018年自然语言理解最火的三种方法

众所皆知的分布式词向量方法CBOM, skip-gram, Glove等已经成为NLP任务的标配，但致命的缺点是无法区别同一个词在不同语境下的含义，如“bank"无论是银行还是河岸的意思，词向量都是同一个，让人脑壳疼。本文要介绍的是2018年很火的三个方法：Elmo, GPT, BERT。它们能够处理多义词、反应不同的语境，从而更好地理解自然语言，并且在下游NLP任务中有突出表现。1 ELMO...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。