GloVe模型的理解及实践（2）

最新推荐文章于 2022-10-23 06:50:26 发布

黄鑫huangxin

最新推荐文章于 2022-10-23 06:50:26 发布

阅读量4k

点赞数 1

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33373858/article/details/83684502

版权

本文介绍了在Ubuntu16.04环境下，使用python 3.5和gensim安装GloVe模型的过程。通过Git从GitHub获取源代码，详细讲解了如何编译生成词向量所需的文件，包括vocab_count、cooccur、shuffle和glove。在训练模型后，执行sh demo.sh得到vectors.txt。此外，还展示了如何在Python中加载模型，找到特定词汇的最相似词，并给出了测试代码及结果。

摘要由CSDN通过智能技术生成

一、运行环境

Ubuntu16.04 + python 3.5

二、安装gensim

两种安装方式

1）打开终端

sudo easy_install --upgrade gensim

2）打开终端

pip install gensim

三、Git官方GitHub代码

https://github.com/stanfordnlp/GloVe

四、生成词向量

1.在glove文件下打开终端进行编译：

make

编译后生成 bin 文件夹，文件夹内有四个文件：

Readme中有关于四个文件的介绍。

1）vocab_count:计算原文本的单词统计（生成vocab.txt文件）

格式为“单词词频”如下图：

最低0.47元/天解锁文章

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。