model.wv.key_to_index #1.获得所有词汇组
model.wv['爱情'] # 2.得到词的向量
model.wv.similarity('爱情', '疯狂') #0.16419926# # 3.计算两个词之间的余弦相似度
# 4.找出不太合群的词
model.wv.doesnt_match("疯狂 痛苦 包含".split()) #这个结果是包含,但是我发现有时候另外一些词并不能正确判断,所以估计还是语料库不够大
# 5.返回与爱情最近的词和相似度
model.wv.similar_by_word("爱情", topn=10, restrict_vocab=30)
# 其中的参数restrict_vocab ,它是可选的整数,它限制了向量的范围,搜索最相似的值。 例如,restrict_vocab = 10000会,只检查词汇顺序中的前10000个词汇向量。
#6.查看词向量的维度,109个词汇,维度为100
model.wv.vectors.shape
# 7.接近词汇A更甚于词汇B接近词汇A的【所有】词汇,按相似度由高到低降序排列
model.wv.closer_than('迷恋','爱情')
Word2vec 的用法
最新推荐文章于 2024-04-27 06:32:07 发布