知识图谱入门知识（五）【转】秒懂词向量Word2Vec的本质

最新推荐文章于 2025-03-12 21:17:40 发布

追赶早晨

最新推荐文章于 2025-03-12 21:17:40 发布

阅读量507

点赞数

分类专栏：知识图谱知识图谱理论基础文章标签：知识图谱

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35222729/article/details/119772033

版权

知识图谱同时被 2 个专栏收录

74 篇文章

订阅专栏

知识图谱理论基础

11 篇文章

订阅专栏

本文详细介绍了Word2Vec的概念，它结合了词性标注和语言模型的特性，通过神经网络将词语转换为数值向量，同时保留上下文信息。Word2Vec包括Skip-gram和CBOW两种模型，前者用词语预测上下文，后者用上下文预测词语。这两种模型通过降维操作将one-hot编码的高维词语表示转化为低维的Word2Vec向量，从而实现词语的高效表示。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

博文：秒懂词向量Word2Vec的本质

什么是Word2Vec？

词性标注：是动词还是名词，样本（x，y）中，x是词语，y是它们的词性

f（x）->y

中的f（神经网络、SVM）只接受数值型输入，而NLP里的词语，必须转换为数值型形式

语言模型：把 x 看做一个句子里的一个词语，y 是这个词语的上下文词语，那么这里的 f，便是 NLP 中经常出现的『语言模型』（language model），这个模型的目的，就是判断 (x,y) 这个样本，是否符合自然语言的法则，更通俗点说就是：词语x和词语y放在一起，是不是人话。

而Word2Vec就是集结了上面两个特征，既要将词语向量化，又能很好的保证上下文信息。这里的f则是上面两个的集合。但是我们的结果不是为了得到它是什么词性，它们符不符合语法，而是得到这之间的中间产物——模型参数，并用这些来得到输入x的向量化表示！

Skip-gram 和 CBOW 模型

上面我们提到了语言模型

如果是用一个词语作为输入，来预测它周围的上下文，那这个模型叫做『Skip-gram 模型』
而如果是拿一个词语的上下文作为输入，来预测这个词语本身，则是『CBOW 模型』

但是作为输入的词语该怎么表示呢？肯定不是Word2Vec，而是one-hot encoder。

这个词向量的维度（与隐含层节点数一致）一般情况下要远远小于词语总数 V 的大小，所以 Word2vec 本质上是一种降维操作——把词语从 one-hot encoder 形式的表示降维到 Word2vec 形式的表示。

再具体的内容请看原博文，写的很细

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。