【NLP】ELMo理解

最新推荐文章于 2024-09-28 18:20:57 发布

吮指原味鸡毛毛

最新推荐文章于 2024-09-28 18:20:57 发布

阅读量142

点赞数

分类专栏： NLP 文章标签：自然语言处理机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/original_recipe/article/details/104928011

版权

NLP 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1.ELMo所解决问题：

CBOW，SkipGram，NNLM等模型训练出来的词向量是Fixed，无法满足同一个单词在不同语境下具有不同的含义，需要动态地学出单词在上下文中的词向量。

2.解决一词多义的可行办法：

a. 给每个单词分配多个词向量

b. 先学习单词fixed的词向量，在应用到某个上下文时再作出相应的调整

c.ELMo（不再得到词的确定的embedding vector, 而是采用两阶段做法，第一阶段先得到一个根据上下文训练好的language model，第二阶段在做downstream任务时，从预训练语言模型中提取对应单词的embedding作为新特征补充道下游任务中，如果把第一阶段得到的中间embedding拿出来用效果很差)

d. BERT

3.ELMo(Deep contextualized word representations)的核心思想：

（1）contextualized指：基于上下文和语言模型（Language Model）的训练方式，使用LSTM；

（2）deep指：基于deep learning的层次表示（Hierarchical Representation），每个层级捕获的特征由简单到复杂

浅层（单词特征）——> 中间层（句法特征）——> 深层（语义特征）

根据以上两点，使用Deep BI-LSTM模型。

4.ELMo的数学表达

ELMo is a task speciﬁc combination of the intermediate layer representations in the biLM. For each token t k , a L-layer biLM computes a set of 2L + 1 representations

For inclusion in a downstream model, we compute a task speciﬁc weighting of all biLM layers:

（1）为什么每个单词有2L+1个representation？

一共L层，每层使用2个LSTM按照从左到右和从右到左两个方向进行基于LM的训练，因此是2L，再加上还有单词原本的词向量。

（2）downstream task中的加权权重如何得到？

通过训练得到weights。

吮指原味鸡毛毛

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

吮指原味鸡毛毛 CSDN认证博客专家 CSDN认证企业博客

码龄7年

35: 原创

9万+: 周排名

130万+: 总排名

11万+: 访问

: 等级

1015: 积分

102: 粉丝

164: 获赞

66: 评论

1054: 收藏

私信

关注

热门文章

分类专栏

NLP 1篇
【SCM】 1篇
阿里云

最新评论

Mysql经典练习题50题
qq_43325210: 18题少了个desc SELECT * FROM (SELECT *,rank() over(PARTITION by sc.cid ORDER BY sc.score DESC)AS ranking FROM sc) AS a WHERE a.ranking <=3;
Mysql经典练习题50题
Wsh1丶手写从前: 第十题先查学过张三课的学生然后学生表筛掉这些 with result1 as ( select a.sId from sctable a inner join course b on a.cId = b.cId inner join teacher t on b.tId = t.tId where tName = '张三' ), result2 as ( select * from student where 1 = 1 and not exists(select 1 from result1 where result1.sId = student.sId) ) select * from result2;
Mysql经典练习题50题
莽撞少年: 21题错误了分别统计男女数量楼主的男生8人女生4人。。原表一共13人。。。有一个同名的，
Mysql经典练习题50题
商朝第一码农: 第十题：题主的答案有点难看懂，简易实现： select Student.Sname from Student where Student.Sname not in (select t3.sname from (select Student.Sname,SC.SId,SC.CId from Student join SC on Student.SId=SC.SId) t3 where t3.cid = 02 ) and Student.Sname not in (select Tname from Teacher); 思路：查询张三老师教过的所有课的课程cid select Course.CId from Course,Teacher where Course.TId = Teacher.TId and Teacher.Tname = '张三'; 查询所有上课学生的姓名学生id 和课程id select Student.Sname,SC.SId,SC.CId from Student join SC on Student.SId=SC.SId 在上表的基础上查询学过02课程的所有同学名单 (select t3.sname from (select Student.Sname,SC.SId,SC.CId from Student join SC on Student.SId=SC.SId) t3 where t3.cid = 02 ) 然后因为还有老师名单在里面，所以再过滤一遍老师的名单 Student.Sname not in (select Tname from Teacher)
Mysql经典练习题50题
搁浅的救赎: 成绩表可以加外键约束

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。