本文参考了一些网上的安装和使用资料,由于没有一篇完整的解决了我的文本,所以并对其进行整合并成功的在我机器中运行(win10 python3.5.2 64bit),如有侵犯那位大大的知识,烦请告知,谢谢。
第一部分:安装gensim库
首先安装python,然后在环境变量中添加相应的路径。其次安装如下gensim依赖的包:
(1)numpy
(2)scipy
(3)pymssql
(下载地址www.lfd.uci.edu/~gohlke/pythonlibs,很方便的一个python包下载地址)
我使用的是pip安装(pip在3.5中已经自带,在安装目录的script下),在这个目录下按住shift+右键,选择“在此处打开命令窗口”,输入pip install numpy,依次安装。
所有依赖包安装成功之后,再次输入 pip install gensim。
参考:http://blog.sina.com.cn/s/blog_4c9dc2a10102v1d5.html
第二部分:word2vec初步试用
参考:http://www.jianshu.com/p/05800a28c5e4
我是在eclipse中运行的,运行时需要设置参数,对项目右键,在process_wiki时右键,选择run as 再选择run configurations,会弹出框框,在里面选择Arguement写入要处理文件的路径和输出路径:
同样在train_word2vec_model时配置路径: