nltk官方文档地址:http://www.nltk.org/
按照python依赖包:
pip安装方法: pip install nltk
离线安装方法:
在这里下载依赖的whl离线包版本: https://pypi.org/project/nltk/#history
进入离线包文件所在的终端输入命令安装:pip install nltk-3.6-py3-none-any.whl
下载nltk也有两种方式:
(强烈不建议,没安装成功过,服务器在国外,网速慢死而且文件还挺大)
第一种:
python终端命令行下载,进入终端,输入python进入python环境:
输入下面两行代码:
import nltk
nltk.download()
不使用代理的话不建议这样下载。没有这样安装过,需要这样安装的童鞋自行百度。
第二种:手动在github上下载然后放到相应的文件夹下
数据的github的官网网站为:https://github.com/nltk/nltk_data
为了加速下载可以到国内码云托管平台下载:
注意:这里下载的是github的全部项目,而我们只需要里面的passage文件内容。
下载完成后将有用的passage文件夹重命名为nltk_data
之后就是把nltk_data放入到程序能找到的位置就行了。
查看nltk寻找的路径如下:随便允许两行代码:
import nltk nltk.word_tokenize("A pivot is the pin or the central point on which something balances or turns")
发现报错如下图所示. 其中有相关的数据找不到的问题。
我们将刚刚重命名的nltk_data放入到下面任意一个目录就可以:
- '/Users/yinchen/nltk_data'
- '/Users/yinchen/opt/anaconda3/envs/ieltsOralPracticeAppraise/nltk_data'
- '/Users/yinchen/opt/anaconda3/envs/ieltsOralPracticeAppraise/share/nltk_data'
- '/Users/yinchen/opt/anaconda3/envs/ieltsOralPracticeAppraise/lib/nltk_data'
- '/usr/share/nltk_data'
- '/usr/local/share/nltk_data'
- '/usr/lib/nltk_data'
- '/usr/local/lib/nltk_data'
- ''
结束了吗?当然没有。
移动到这里后发现还是报如下相同数据找不到错误。
为了能够成功运行,还需要最后一步解压操作。通过错误可以发现是punkt数据找不到。nltk_data文件夹下是存在这个zip文件的nltk_data->tokenizers->punkt.zip。我们只需要解压当前文件夹即可。再次运行后程序成功运行。
恭喜!成功运行!!!