word2vec

word2vec demo: 里面的具体的解释还得后面分析

#encoding:utf-8
#@Time : 2017/8/18 11:48
#@Author : JackNiu

# 引入 word2vec
from gensim.models import word2vec

# 引入日志配置
import logging

logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)

# 引入数据集
raw_sentences = ["the quick brown fox jumps over the lazy dogs","yoyoyo you go home now to sleep"]

# 切分词汇
sentences= [s.split() for s in raw_sentences]

# 构建模型
model = word2vec.Word2Vec(sentences, min_count=1,size=20)
print(model['you'])
print(model.compute_loss)
'''
直接获取某个单词的向量表示,也就是说该单词可以用别的10个单词来描述
[-0.02901401 -0.04214518 -0.02739167  0.04414326  0.01985594  0.02784069
 -0.0034573   0.049661    0.02452401  0.01624114]

'''

print(model['lazy'])
print(model.most_similar(positive=["dogs"],topn=30))
# 进行相关性比较
sim =model.similarity('dogs','you')
print(sim)

'''
具体的里面的模型解释还需要后面的知识来进行分析。

'''
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值