Word2Vec之CBOW详解

最新推荐文章于 2025-03-16 08:29:53 发布

Feather_74

最新推荐文章于 2025-03-16 08:29:53 发布

阅读量9.2k

点赞数 17

分类专栏： NLP自然语言处理文章标签： word2vec 人工智能 nlp 1024程序员节

本文链接：https://blog.csdn.net/qq_44997147/article/details/120875909

版权

NLP自然语言处理专栏收录该内容

3 篇文章

订阅专栏

CBOW是一种用于生成词向量的模型，它通过上下文窗口预测目标词。输入层使用One-hot编码，隐藏层通过平均输入词向量得到隐藏层向量，再通过输出层的softmax分类器预测目标词的概率。CBOW模型常用于自然语言处理中的词嵌入技术。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

CBOW介绍

CBOW分为输入层 Input layer 、隐藏层 Hidden layer 、输出层 Output layer 。
在这里插入图片描述

一、输入层 Input layer

1、输入的是 One-hot 编码的 vector 。

什么是 One-hot 编码？
One-hot 编码又称一位有效编码，是将文字数字化的过程。举个例子，一个 corpus （语料库）为“ I drink coffee everyday ”。假设将单词放入数组 str ，则该数组 str 长度为4， vector 也就是4维向量。str[0]=“I”，str[1]=“drink”，str[2]=“coffee”，str[3]=“everyday”。把他转换成One-hot编码就是

单词	One-hot 编码
I	[1,0,0,0]
drink	[0,1,0,0]
coffee	[0,0,1,0]
everyday	[0,0,0,1]

2、输入层总共有 C 个 V 维 vector 。C 是由 window size （上下文窗口大小）决定的，window size 代表我们从 target word 的一边（左边或右边）选取词的数量。假设 target word 是 coffee ， window size 为2，那么则在 coffee 左侧和右侧分别选取2个词，则 C=2+2=4。V 表示语料库中词的个数，即 One-hot vector 的维度 V（window size*2=C<=V）。

在这里插入图片描述