【word2vec】之训练模型结果的结构探究模型改造 python gensim

最新推荐文章于 2024-08-19 09:22:40 发布

sscssz

最新推荐文章于 2024-08-19 09:22:40 发布

阅读量7k

点赞数 1

分类专栏： word2vec nlp 技术学习 Python 文章标签： python word2vec nlp 自然语言处理 gensim

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sscssz/article/details/51921392

版权

本文介绍了如何通过gensim库在Python中加载和操作word2vec模型，详细解析了模型的内部结构，包括词汇表、词向量等，并展示了如何将训练好的模型转换为文本格式以便进一步处理。

摘要由CSDN通过智能技术生成

word2vec的安装，应用帖子好多，那如果想在训练的结果，也就是得到的向量上做点儿文章，该如何呢

下面来说说word2vec（python的gensim包）训练得到的模型，以及得到的向量是什么样子的

因为python训练得到的结果是二进制的，说白了就是乱码，现在既然想得到整个结果，该怎么弄呢。

其实好多事情直接看源码就能得到。之前试图找api或者小伙伴的帖子，想看看model的结构是什么样子的，未遂，只好直接自己一点儿点儿看源码。

首先我们假设，已经训练好了一个模型，现在只需要load就行了

 
 model = gensim.models.Word2Vec.load('/mymodel_wds_wiki_all') 

首先，获得一个词的词向量可以直接通过这样的方式获得

 
 print len(model['中国'])
 print type(model['中国'])
 print (model['中国']) 

得到的结果如下，可见类型是numpy.ndarray，维度是默认的一百维

100

<type 'numpy.ndarray'>

[-1.36747932 1.64107883 2.22578478 -2.02663827 3.4452529 1.86765969 ……]

下面直接看model的代码

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。