本想尝试做一下CS224N 的Assignment 1: Exploring Word Vectors,代码粘过来,简单省事,想看下运行效果,天啦噜,就遇到了这样问题,出现的问题情况描述如下图:
看来还是要自己下手了,还好提示很明显嘛,So easy,缺少了gensim这个模块,我们接下来去安装就可以了。
一.先了解下什么是gensim
gensim是一个python的科学库,gensim包含了TF-IDF、随机投影、word2vec和document2vec算法的实现,分层Dirchlet过程(HDP),潜在语义分析(LSA)和潜在Dirichlet分配(LDA),包括分布式并行版本。主要是用来主题建模、文档索引以及使用大规模语料数据的相似性检索,被作者称为“根据纯文本进行监督性建模最健壮、最有效的、最让人放心的软件”。
二.注意
安装之前提示一下,切记,因为要下载一些东西,所以安装过程中网络不要断了,保持连接,重要的事情说三遍,网络网络网络。
三.安装步骤如下:
- 艰难的更新了pip
- 费劲的安装了gensim
1.艰难的更新了pip步骤
安装下载东西,简直超级简单呀,win+r,cmd输入pip install gensim.models结果,什么?!报错了?果然windows对python不是很友好,无语呀,出错如下图显示。
大概意思就是版本太老了,我确实下载没有很久呀,居然有需要更新了,强大的技术人员,佩服佩服呀,好吧,按照他的提示输入python -m pip install --upgrade pip来更新吧,然鹅,事情似乎并不那么简单,同样的问题再一次出现,证明了上一句并没有什么卵用,果断生气。
参考了别人的博客,终于找到了正确答案:python -m pip install -U pip
这久违的成功终于出现了,开森。努力提示自己莫慌,接下来还有一步,安装gensim呀,来吧,继续。
2.费劲的安装了gensim
gensim包、貌似挺有名的,里面有个Word2Vec。
再一次老练地输入:pip install --user gensim.models
结果报错了、、、、??
大概意思应该是找不到gensim.models这个玩意,找不到就应该是名称有误,是下载gensim吧,试一下看。直接输入python -m pip install gensim,可以了,离成功很近了,进度条在加载了,但是会出现timeou提示,好吧,继续探索啥子,各种搜索,查询csdn大神的解决方案输入pip --default-timeout=1000 install pip ,,这个timeout在没改之前是100来着,这样就OK了,显示如下了。
好的,紧接着:python -m pip install --user gensim,在这个地方,本菜鸡出现了一个低级错误,耗费了大量时间,在这个安装过程中,一定要连接网络,不能断了网络,切记切记,否则会出现一些意想不到的错误,,,,,???,我也是挣扎了很久发现了没有网了,然后连接上后就可以正常执行下载了,下载过程比较缓慢,emmmm…耐心等下啦,如下图。
到此终于成功安装了一个模块,看下胜利的截图吧,开森一下子。
哈哈,综上来说,正确答案是:
pip --default-timeout=1000 install -U pip
python -m pip install --user gensim
终于OK了,欢迎指正
参考链接:https://blog.csdn.net/weixin_40268992/article/details/82795622