一、什么是gensim
gensim是一个python的科学库,gensim包含了TF-IDF、随机投影、word2vec和document2vec算法的实现,分层Dirchlet过程(HDP),潜在语义分析(LSA)和潜在Dirichlet分配(LDA),包括分布式并行版本。主要是用来主题建模、文档索引以及使用大规模语料数据的相似性检索,被作者称为“根据纯文本进行监督性建模最健壮、最有效的、最让人放心的软件”。
二、gensim安装的注意事项
gensim可以安装在Windows、Linux和Mac OS以及其他的平台,但是它需要依赖python和numpy以及scipy,如下图
至于numpy和scipy的安装我们可以直接安装一个anaconda就可以了,它也是python的一个科学计算库,它包含了python常用的科学计算库。gensim官网http://radimrehurek.com/gensim/
三、安装步骤
1、在安装anaconda之后,找到anaconda的安装路径,将anaconda下的scripts目录添加到,计算机-->属性-->高级系统设置-->高级-->环境变量-->系统变量-->找到path变量,将C:\Users\15053\Anaconda3\Scripts添加到path中,这个目录是我安装anaconda的目录,根据自己电脑的安装目录进行配置。
2、windows+r-->输入cmd-->输入python,如果出现如下图的提示说明配置成功了
3、找到anaconda的安装目录,在箭头指示的栏中输入cmd,然后打开命令提示符界面之后,输入pip install gensim安装gensim
4、输入命令可以安装gensim,但是你会发现,貌似下载的进度等了半天都没有变化,就像我这样,如果遇到这种情况情况5,,如果没有可以跳过以下步骤
5、为了解决这个问题,最后,我是先用IDM在gensim的官网下载了gensim2.3的版本,然后手动安装,将下载好的gensim进行解压,然后打开gensim的解压目录,在3所指向的栏中输入cmd后,然后输入python setup.py install,gensim2.3.0的下载地址http://download.csdn.net/detail/sinat_29957455/9922390
6、验证gensim是否安装成功,打开cmd输入python之后,然后在输入import gensim,出现下图一样,就表示安装成功了
特别提醒:如果,安装完成之后发现import gensim没有问题,但是使用from gensim import word2vec时报错时,建议去gensim官网下载MS windows install的exe程序进行安装,下载地址https://pypi.python.org/pypi/gensim,需要注意的是,安装的时候请确保gensim要求的环境都有,而且要下载和python的版本以及操作系统的版本一致的gensim进行安装,不然无法安装。安装完成之后,如果有警告可以忽略,如果有看到 ImportError: No module named 'smart_open',我们打开cmd,输入pip install smart_open安装好了,再次导入即可正常运行。
注意:特别需要注意的是,安装的gensim版本必须要和要求的python版本以及numpy、SciPy一致,否则可能会导致安装失败。
<li class="tool-item tool-active is-like "><a href="javascript:;"><svg class="icon" aria-hidden="true"> <use xlink:href="#csdnc-thumbsup"></use> </svg><span class="name">点赞</span> <span class="count">2</span> </a></li> <li class="tool-item tool-active is-collection "><a href="javascript:;" data-report-click="{"mod":"popu_824"}"><svg class="icon" aria-hidden="true"> <use xlink:href="#icon-csdnc-Collection-G"></use> </svg><span class="name">收藏</span></a></li> <li class="tool-item tool-active is-share"><a href="javascript:;" data-report-click="{"mod":"1582594662_002"}"><svg class="icon" aria-hidden="true"> <use xlink:href="#icon-csdnc-fenxiang"></use> </svg>分享</a></li> <!--打赏开始--> <!--打赏结束--> <li class="tool-item tool-more"> <a> <svg t="1575545411852" class="icon" viewBox="0 0 1024 1024" version="1.1" xmlns="http://www.w3.org/2000/svg" p-id="5717" xmlns:xlink="http://www.w3.org/1999/xlink" width="200" height="200"><defs><style type="text/css"></style></defs><path d="M179.176 499.222m-113.245 0a113.245 113.245 0 1 0 226.49 0 113.245 113.245 0 1 0-226.49 0Z" p-id="5718"></path><path d="M509.684 499.222m-113.245 0a113.245 113.245 0 1 0 226.49 0 113.245 113.245 0 1 0-226.49 0Z" p-id="5719"></path><path d="M846.175 499.222m-113.245 0a113.245 113.245 0 1 0 226.49 0 113.245 113.245 0 1 0-226.49 0Z" p-id="5720"></path></svg> </a> <ul class="more-box"> <li class="item"><a class="article-report">文章举报</a></li> </ul> </li> </ul> </div> </div> <div class="person-messagebox"> <div class="left-message"><a href="https://blog.csdn.net/sinat_29957455"> <img src="https://profile.csdnimg.cn/3/D/D/3_sinat_29957455" class="avatar_pic" username="sinat_29957455"> <img src="https://g.csdnimg.cn/static/user-reg-year/2x/5.png" class="user-years"> </a></div> <div class="middle-message"> <div class="title"><span class="tit"><a href="https://blog.csdn.net/sinat_29957455" data-report-click="{"mod":"popu_379"}" target="_blank">修炼之路</a></span> <span class="flag expert"> <a href="https://blog.csdn.net/home/help.html#classicfication" target="_blank"> <svg class="icon" aria-hidden="true"> <use xlink:href="#csdnc-blogexpert"></use> </svg> 博客专家 </a> </span> </div> <div class="text"><span>发布了237 篇原创文章</span> · <span>获赞 609</span> · <span>访问量 154万+</span></div> </div> <div class="right-message"> <a href="https://bbs.csdn.net/topics/395532886" target="_blank" class="btn btn-sm btn-red-hollow bt-button personal-messageboard">他的留言板 </a> <a class="btn btn-sm bt-button personal-watch" data-report-click="{"mod":"popu_379"}">关注</a> </div> </div> </div>
转载链接:https://blog.csdn.net/sinat_29957455/article/details/76735301