nlp期末复习-词向量

最新推荐文章于 2024-05-28 22:15:45 发布

xiaohuixiao！

最新推荐文章于 2024-05-28 22:15:45 发布

阅读量337

点赞数 1

分类专栏： nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42182596/article/details/106926185

版权

1、不能体现词的含义进行编码（one-hot）

2、单词按照含义进行编码成向量的方式称为word embedding

Word Embedding：Word2Vec(CBOW/Skip-gram)—>Glove

使用Word Embedding：句子中每个单词以Onehot形式作为输入，然后乘以学好的Word
Embedding矩阵Q，就直接取出单词对应的Word Embedding了
Word2Vec
CBOW模型的训练输入是某一个特征词的上下文（context）相关的词对应的词向量，而输出就是这特定的一个词（目标单词target）的词向量。

核心思想是从一个句子里面把一个词抠掉，用这个词的上文和下文去预测被抠掉的这个词；

skip-gram模型和CBOW模型相反，目标单词现在在输入层，上下文单词在输出层

3、从Word Embedding到Bert模型

Word Embedding：Word2Vec(CBOW/Skip-gram)—>Glove

!!!无法解决词的多义问题

缺点：
Word Embedding在对bank这个单词进行编码的时候，是区分不开这两个含义的，因为它们尽管上下文环境中出现的单词不同，但是在用语言模型训练的时候，不论什

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
nlp期末复习-词向量

1、不能体现词的含义进行编码（one-hot）2、单词按照含义进行编码成向量的方式称为word embeddingWord Embedding：Word2Vec(CBOW/Skip-gram)—>Glove使用Word Embedding：句子中每个单词以Onehot形式作为输入，然后乘以学好的WordEmbedding矩阵Q，就直接取出单词对应的Word Embedding了Word2VecCBOW模型的训练输入是某一个特征词的上下文（context）相关的词对应的词向量，而输出
复制链接

扫一扫

专栏目录

xiaohuixiao！ CSDN认证博客专家 CSDN认证企业博客

码龄6年

43: 原创

41万+: 周排名

120万+: 总排名

4万+: 访问

: 等级

649: 积分

16: 粉丝

35: 获赞

4: 评论

98: 收藏

私信

关注

热门文章

分类专栏

OCR 4篇
人脸识别 3篇
日常学习 1篇
深度学习 9篇
论文 4篇
nlp 10篇
大数据分析 1篇
nlp文本分类 1篇
剑指刷题 7篇
nlp翻译 2篇

最新评论

使用jTessBoxEditorFX制作自己的字库
DnY>: 你好，我无法打开图片训练，请问这该怎么处理呢
bert在多分类等应用
窗台的老猫: 您好，请问MLM中那种图片中的意思，是求词汇表中所有单词的一个概率嘛
nlp-自然语言处理三大特征抽取器（CNN/RNN/TF）比较
TerryBlog: 这只是三个主流使用DL的 NMT 架构，传统方法抽取特征还是用统计ML。。。
基于图像的表情识别
keep_hardworking: 博主，有没有MMI人脸表情的数据集，快毕业写小论文要用，在官网申请好久都没有申请到账号，私信作者也邮件也被系统拒收，特别着急，有的话方便分享一下吗？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。