简单理解ELMO

最新推荐文章于 2021-04-22 17:42:42 发布

真心乖宝宝

最新推荐文章于 2021-04-22 17:42:42 发布

阅读量1k

点赞数 3

分类专栏： NLP知识点

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45069761/article/details/107859608

版权

ELMO 本身是个根据当前上下文对 Word Embedding 动态调整的思路

ELMO 采用了典型的两阶段过程，第一阶段是利用语言模型进行预训练；第二阶段是在做下游任务时，从预训练网络中提取对应单词的网络各层的 Word Embedding 作为新特征补充到下游任务中。
上图展示的是其预训练过程，它的网络结构采用了双层双向LSTM，目前语言模型训练的任务目标是根据单词W的上下文去正确预测单词W, W之前的单词序列 Context-before称为上文，之后的单词序列 Context-after称为下文。
图中左端的前向双层LSTM代表正方向编码器，输入的是从左到右顺序的除了预测单词W外的上文Context-before；右端的逆向双层 LSTM 代表反方向编码器，输入的是从右到左的逆序的句子下文Context-after；每个编码器的深度都是两层 LSTM 叠加。
这个网络结构其实在 NLP 中是很常用的。使用这个网络结构利用大量语料做语言模型任务就能预先训练好这个网络，
如果训练好这个网络后，输入一个新句子Snew，句子中每个单词都能得到对应的三个Embedding:最底层是单词的Word Embedding，往上走是第

最低0.47元/天解锁文章

真心乖宝宝

关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
简单理解ELMO

ELMO 本身是个根据当前上下文对 Word Embedding 动态调整的思路ELMO 采用了典型的两阶段过程，第一阶段是利用语言模型进行预训练；第二阶段是在做下游任务时，从预训练网络中提取对应单词的网络各层的Word Embedding 作为新特征补充到下游任务中。上图展示的是其预训练过程，它的网络结构采用了双层双向LSTM，目前语言模型训练的任务目标是根据单词W的上下文去正确预测单词W, W之前的单词序列 Context-before称为上文，之后的单词序列 Context-after
复制链接

扫一扫

专栏目录

真心乖宝宝 CSDN认证博客专家 CSDN认证企业博客

码龄5年

84: 原创

24万+: 周排名

163万+: 总排名

13万+: 访问

: 等级

1695: 积分

29: 粉丝

176: 获赞

53: 评论

459: 收藏

私信

关注

热门文章

分类专栏

最新评论

如何判断有向图有环 --＞拓扑排序
Eli A: 下面放个链接疯狂跳转美团和淘宝什么意思
如何判断有向图有环 --＞拓扑排序
陌上迟迟归: 刚刚还把这道题提交给老师下午讲，看了你的，发现完了，我会了，这挺简单我还问老师不会杀了我吧
GBDT是否需要进行归一化操作？
TingXiao-Ul: 树模型都不需要归一化操作，同样GBDT也不需要。以树模型作基学习器，特征的作用都只是用来分裂节点，scaling不scaling不会影响分裂的结果
GBDT是否需要进行归一化操作？
TingXiao-Ul: 树模型都不需要归一化处理，同样GBDT也不需要，以树模型作基学习器，特征的作用都只是用来分裂节点，scaling不scaling不会影响分裂的结果
git代码回滚
泡面盖饭: 非常不错，感谢楼主的分享

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。