最近看了一些关于自然语言处理方面的书,对其很感兴趣,在昨天晚上搞到了深夜,总算功夫不负有心人,现在基础环境已经搭建完成,闲言少叙,现将搭建的具体过程和遇到的问题分享给大家。
基础环境:windows 7 32位操作系统
1.安装Python(我安装的是Python2.7,目录C:\Python27)。可以到CSDN、OSChina、Sina Share等网站下载,也可以到Python官网下载:http://www.python.org/(推荐用这个)。
2.添加环境变量。在命令行模式下输入:set PATH=%PATH%;C:\Python27这种方法最容易,当然也可以在计算机-->属性-->高级系统设置-->环境变量,添加系统变量,变量名为PATH,对应的属性值为C:\Python27即可。
3.在命令行模式下运行python,出现如下图所示,即说明Python已安装成功。
4.安装NLTK(我下载的是nltk-3.0.0)到这里下载:http://pypi.python.org/pypi/nltk
把nltk-3.0.0解压到C:\Python27目录,打开cmd,进到C:\Python27\nltk-2.0.3目录(输入:cd C:\Python27\nltk-3.0.0)
输入命令:python setup.py install
5.这个时候,会报错,因为缺少setuptools包没有安装。下载setuptools包,地址:http://www.cncrk.com/downinfo/28512.html,安装后再运行python setup.py install命令即可。
6.安装PyYAML:到这里下载:http://download.csdn.net/detail/caicai1617/7023063
下载之后执行exe文件(程序会自动搜索python27目录)
7.在所有程序中找到python2.7文件夹,打开IDLE,输入import nltk,没有错误的话,就说明安装成功了。到这里,NLP所需的基本python模块都已经安装好了,然后要安装NLTK_DATA了下载NLTK_DATA有好几种方法,这里我只介绍两种。第一种:输入import nltk,然后输入nltk.download(),这样就可以打开一个NLTK Downloader(NLTK下载器),注意下载器下边的Download Directory,我设置的是C:\nltk_data。(这种方法很慢,并且安装了几次都不能全部安装)第二种:上360云盘下载:http://aczaym88yr.l3.yunpan.cn/lk/cgGUPFzF3spir,提取码为504e。下载好之后,放到C:\nltk_data目录下。因为是压缩包,选择C:\nltk_data\corpora目录下的所有压缩文件,选择解压到当前文件夹。(之后再用到其他的文件,再进行类似的解压即可)
8.在计算机-属性-高级系统设置-高级-环境变量-系统变量-新建:变量名:NLTK_DATA,属性值:C:\nltk_data。这一步与上面第二步的操作基本相同。
9.在IDLE下输入:form nltk.book import *会出现下图所示:
10.测试环境搭建的效果:接着第九步的操作,输入:text2.concordance('is');结果如下所示:
说明:text2为NLTK数据包中的一段数据源,是一大串字符串。这句话实现的是从这一大串字符串中找寻出包含is这个单词的语句。
到此为止,基本的搭建已经完成,初学者的一点经验,也是每个要学习自然语言分析必会的基本知识。如有什么不懂的,欢迎在下面评论,我会及时回复。