先说说搭建nltk环境大概要装些什么东西:
numpy(1、一个强大的N维数组对象Array;2、比较成熟的(广播)函数库;3、用于整合C/C++和Fortran代码的工具包;4、实用的线性代数、傅里叶变换和随机数生成函数)
scipy(高等数学、信号处理、优化、统计和许多其它科学任务的语言)
matplotlib(二维画图)
nltk(自然语言工具包)
pyyaml(解析yaml语言)
nltk-data(nltk数据包)
我的windows环境比较特殊,是64位的,装的也是Python2.7 64位的,但是貌似nltk环境很多都是win32的,所以这里我介绍的是64位的安装教程
1安装numpy
到网上下载wheel包(numpy-1.13.3+mkl-cp27-cp27m-win_amd64.whl),我这里给出链接
https://pan.baidu.com/s/1dxQdBo
df6s
大家也可以照着名字去网上找
安装:cmd进入windows命令
例如我上图当前环境是在C:\Users\Administrator下,就要把numpy的wheel包放到该目录下调用pip安装时才能找到这个安装包
使用pip install numpy-1.13.3+mkl-cp27-cp27m-win_amd64.whl 安装
pip安装以及环境变量的配置大家可以网上找,我这里就不多说了
安装完之后我们可以使用Python的ide工具打开然后import numpy运行没有报错就安装完成了
2安装scipy
跟安装numpy类似,先下载64位的wheel包(scipy-1.0.0-cp27-cp27m-win_amd64.whl)
https://pan.baidu.com/s/1i6briKX
7ze8
打开windows命令行,将wheel包放在windows当前的目录下(如C:\Users\Administrator),pip install scipy-1.0.0-cp27-cp27m-win_amd64.whl 进行安装
新建一个Python文件import scipy运行一下没报错就安装成功了
3安装matplotlib
网上下载64位的matplotlib安装包,这个比较好找是.exe安装文件,双击安装,如果你的python有注册的话就可以自动找到python的注册路径然后把matplotlib安装进去了
matplotlib:
https://pan.baidu.com/s/1brk7dhl
wyu4
python如何注册的,大家可以看我这篇博客,就是运行一下一个注册的py文件就行了
http://blog.csdn.net/qq_26614295/article/details/78352490
安装完matplotlib后我们新建一个py文件用Import matplotlib运行后可能会报错
说明有matplotlib依赖的几个包还没安装完成
这里使用工具easy_install安装,easy_install怎么安装和配置环境变量大家可以自行百度
进入windows命令行,分别输入以下命令安装需要的包
easy_install python-dateutil
easy_install pyparsing
easy_install cycler
上图给出dateutil模块的安装
然后新建一个Py文件再次import matplotlib运行一下应该就没有报错了
4安装pyyaml
进入windows命令行
输入pip install pyyaml
5安装nltk(关键)
下载nltk
https://pan.baidu.com/s/1qZKyhbQ
hq9x
是一个nltk-3.0.0的名字,大家把他命名成nltk然后放到python的安装目录下,我这里python的安装目录(D:\Python27)
打开windows命令行,输入python进入python命令行(前提是要把python添加进环境变量)
进入nltk目录
import os
os.chdir("D:\\python27\\nltk\\")
使用里面的setup.py安装
setup.py install
新建一个py文件,用ide工具打开后,import nltk,运行没有报错就可以了
有些可能会报错提示缺少一些模块,使用 pip install 模块名就可以了,如pip install six
6安装nltk数据包
新建一个Python文件,用ide工具打开输入代码
import nltk
nltk.download()
运行后会弹出一个窗口提示下载nltk数据包,选择图中的all,然后修改下载的目录,例如我这里想下载在D:\nltkdata这个目录,然后点击download,耐心等待安装完成
注意:
1如果不小心双击了图中的一行,如all,那么下面的状态不是提示finished……,而是提示aborting download,就是终止下载了,这时候只需要再次双击这行all就可以继续下载
2点击all packages图中选项卡,里面显示的是所有要安装的包,我们要观察在download之后还有没有提示not installed的包,如果有out of date的不用管他,因为是过时的包,如果有not installed的包,就只需要双击对应的包就可以安装了
将nltk数据包加入环境变量:我的电脑-右键-属性-高级系统设置-高级-环境变量-系统变量下新建-变量名为:NLTK_DATA,变量值为你下载的路径如我的就是D:\nltkdata
新建一个py文件测试
import nltk
from nltk.book import *
导入下载的可供实验的数据,如果看到加载了text1-text9,那就成功啦。