Word2vec 的用法

最新推荐文章于 2024-04-27 06:32:07 发布

今夕节度使

最新推荐文章于 2024-04-27 06:32:07 发布

阅读量218

点赞数 1

文章标签： word2vec 人工智能自然语言处理

本文链接：https://blog.csdn.net/wanghan0526/article/details/131456809

版权

model.wv.key_to_index #1.获得所有词汇组

model.wv['爱情'] # 2.得到词的向量

model.wv.similarity('爱情', '疯狂') #0.16419926# # 3.计算两个词之间的余弦相似度

# 4.找出不太合群的词
model.wv.doesnt_match("疯狂 痛苦 包含".split()) #这个结果是包含，但是我发现有时候另外一些词并不能正确判断，所以估计还是语料库不够大

# 5.返回与爱情最近的词和相似度
model.wv.similar_by_word("爱情", topn=10, restrict_vocab=30)
# 其中的参数restrict_vocab ，它是可选的整数，它限制了向量的范围，搜索最相似的值。 例如，restrict_vocab = 10000会，只检查词汇顺序中的前10000个词汇向量。


#6.查看词向量的维度,109个词汇，维度为100
model.wv.vectors.shape

# 7.接近词汇A更甚于词汇B接近词汇A的【所有】词汇,按相似度由高到低降序排列
model.wv.closer_than('迷恋','爱情')