win7+python3.4 +nltk搭建自然语言处理环境
- python3.4下载安装
(1)python3 64位有各种各样问题,因此直接安装的python3.4 win32位版本的
附链接:http://download.csdn.net/detail/dreamingfish2011/9548554
(2)python3 以上自带了pip,不需要安装,我进行了升级。
pip install --upgrade pip
- nltk需要安装的依赖包
如下图所示,nltk需要安装numpy,PyYAML,matplotlib,nltk和nltk_data(这个不是依赖包,是nltk的资源包)
这几个包分别使用以下源
其中,numpy官方的源和python3以上在windows有兼容有些问题,安装过程报错太多,我直接从Christoph Gohlke在其个人主页上提供了非官方的Windows源:http://www.lfd.uci.edu/~gohlke/pythonlibs/
其他包下载链接:http://download.csdn.net/detail/dreamingfish2011/9548552
- 安装
(1)python3.4直接双击运行安装,安装后配置环境变量,将D:\IDE\Python34;和D:\IDE\Python34\Scripts;配置到path中。
(2)解压matplotlib后,进入解压缩目录
执行python setup.py install命令
(3)解压PyYAML后,进入解压缩目录
执行python setup.py install命令
(4)numpy安装
cmd打开命令行后
执行 pip install “path to numpy.whl”命令
(5)nltk安装,直接双击执行exe文件
至此,python3.4和nltk插件安装完成,下面下载需要的nltk资源 - nltkdata下载
选择all,设定好下载路径。然后点击Download,下载的时间较长。或者也可以到http://nltk.org/nltk_data/ 来手动下载。
(1)如果手动指定了nltk_data的保存目录,需要添加环境变量
例如:
否则会报错:
[1] http://delbert.me/archives/740.html
[2] http://www.lfd.uci.edu/~gohlke/pythonlibs/