常见词向量获取方式总结记录（面试）

最新推荐文章于 2024-05-30 20:21:25 发布

pppppppppppx

最新推荐文章于 2024-05-30 20:21:25 发布

阅读量82

点赞数 1

分类专栏： NLP基础知识文章标签：深度学习机器学习人工智能自然语言处理 lstm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_57148141/article/details/130490013

版权

NLP基础知识专栏收录该内容

3 篇文章 0 订阅

订阅专栏

3.1 ONE - HOT（Bag-of-word）

缺点显而易见，一是 onehot 编码向量维度将会很高，二是 onehot 编码并不能体现语义信息。

3.2 N-Gram(统计语言模型）

相较于 ONE - HOT 考虑了词序。

3.3 GloVe（基于所有语料）

基于统计的获取词向量的方法，基本思想是：用 一个词语周边其他词语出现的次数（或者说两个词共同出现的次数）来表示每一个词语 ，此时 每个词向量的维度等于词库容量，每一维存储着词库对应序号的词语出现在当前词语周围的次数，所有这些词向量组成的矩阵就是 共现矩阵。

3.4 NNLM（神经网络语言模型）

NNLM 本身不产生词向量，NNLM 的主要任务是要学习一个解决语言模型任务的网络结构，语言模型就是要看到上文预测下文，而 Word Embedding只是 NNLM 无心插柳的一个副产品；但是 Word2Vec 目标不一样，它单纯就是要 Word Embedding 的，这是主产品，所以它完全可以随性地这么去训练网络。

3.5 Word2Vec

CBOW(Continuous Bag-of-Words 连续词袋) 和 Skip-gram 分别用 上下文预测中心词 和 中心词预测上下文 注意采用负采样减少梯度下降复杂度。

3.6 ELMo (BiLSTM)

得到的词向量包含前后文信息，但LSTM是串行机制，训练时间长，相比于Transformer，LSTM提取特征的能力还是不够，依然存在梯度消失，梯度爆炸。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
常见词向量获取方式总结记录（面试）

但是 Word2Vec 目标不一样，它单纯就是要 Word Embedding 的，这是主产品，所以它完全可以随性地这么去训练网络。，每一维存储着词库对应序号的词语出现在当前词语周围的次数，所有这些词向量组成的矩阵就是。，NNLM 的主要任务是要学习一个解决语言模型任务的网络结构，语言模型就是要。基于统计的获取词向量的方法，基本思想是：用。缺点显而易见，一是 onehot 编码向量。，相比于Transformer，LSTM。3.2 N-Gram(统计语言模型），二是 onehot 编码并。
复制链接

扫一扫

专栏目录

pppppppppppx CSDN认证博客专家 CSDN认证企业博客

码龄3年

12: 原创

60万+: 周排名

109万+: 总排名

4031: 访问

: 等级

148: 积分

2: 粉丝

19: 获赞

2: 评论

27: 收藏

私信

关注

热门文章

分类专栏

最新评论

计算机综合基础知识记录（408、面试）
CSDN-Ada助手: 恭喜作者写出了这篇关于计算机综合基础知识的博客！这篇博客内容丰富，涵盖了408考试和面试的知识点，对于正在准备这两项考试的读者来说一定十分有帮助。同时，也感谢作者的辛勤付出，分享自己的学习经验和知识。对于下一步的创作建议，我认为可以考虑在这个基础上，进一步拓展知识点，分享更多的学习经验和心得。同时，还可以结合实际工作中的问题，分享解决问题的思路和方法。期待作者的更多精彩作品！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
计算机综合基础知识记录（408、面试）
CSDN-Ada助手: 恭喜您写了这篇“计算机综合基础知识记录（408、面试）”的博客，内容非常实用，相信对很多读者都会有所帮助。希望您能够继续保持创作的热情，分享更多有价值的知识。同时，也建议您可以结合实际案例，深入阐述一些具体的技术问题，让读者更好地理解和应用。期待您的下一篇博客！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
国内外技术社区及个人博客分享
CSDN-Ada助手: 恭喜您开始了博客创作的旅程！国内外技术社区及个人博客分享是一个十分丰富多彩、知识海洋般的领域，希望您能够在其中不断学习、成长，分享您的技术见解和经验。期待看到更多优质的博客文章！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
机器学习（ML）深度学习（DL）基础知识记录（面试）
CSDN-Ada助手: 恭喜您写完了第三篇博客，标题也十分吸引人。内容涉及到机器学习和深度学习的基础知识，对于想要在这个领域发展的人来说，一定非常有帮助。接下来，建议您可以在这个基础上，继续深入探究一些更加细节的问题，让读者能够更加全面地了解这个领域。期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。