目录
问题分析
NLTK一般是在作自然语言处理时用到,最开始时,我是直接在conda进行`conda install nltk`进行安装,以为就可以直接使用,但是运行时总会出现以下情况
[nltk_data] error loading wordnet: <urlopen error [errno 11004]
[nltk_data] getaddrinfo failed
所以就开始想办法解决,最开始以为是找不到wordnet包,所以就先手动下载WordNet,然后把dowload改为相对地址了,但是发现问题并没有解决,还是用不了,所以就看了官网
官网地址:NLTK :: Installing NLTK Data
下载
import nltk
nltk.download()
报错
然后会出现一个新窗口,类似下面这张图
最开始运行时,我的这个窗口页面是空的,并且报错
Error 11004 getaddrinfo failed
报错原因
将 Server Index复制到浏览器,发现
所以,报错原因是下面的Server Index无法下载访问
正确ip获取
我们需要对ip进行修改,就需要先获取正确的ip
访问以下网址
https://www.ipaddress.com/
点击IP Address Lookup进行ip查询 (注:查询出的ip可能不止一个)
raw.githubusercontent.com
写入host文件
将查询到的ip写入host文件
对于window系统,host路径为`C:\Windows\System32\drivers\etc`,直接访问,然后使用记事本或者BowPad进行修改
将其添加到最下面即可
再次下载
然后再次下载
运行
import nltk
nltk.download()
此时窗口表格会出现内容,点击download进行下载即可,等待下载完成如下图,并点击关闭
测试是否成功
利用代码进行测试
from nltk.corpus import brown
brown.words()