词向量(Word Embedding)是一种将文本中的单词转化为数字向量的方法。通常情况下,每个单词都会被表示为一个固定维度的向量,这些向量可以用来表示单词的语义(semantic meaning)。
例如,假设我们有一个简单的文本数据集,包含以下几个句子:
- "The cat sat on the mat."
- "The dog chased the cat."
我们可以使用一个已经预训练好的词向量模型,来为这个文本数据集中的每个单词生成一个向量。比如,我们可以将 "cat" 这个单词表示为一个 50 维的向量,"dog" 这个单词表示为另外一个 50 维的向量。
下面是一个使用