nltk_data下载错误 Error loading stopwords: urlopen error [Errno 11004] 解决办法
[nltk_data] Error loading stopwords: <urlopen error [WinError 10054]
前言
这是由于nltk
的stopwords
语料下载错误,nltk
的其他语料下载错误也会出现这个错误。
我尝试了几种方法
- 直接在 nltk_data 的官网下载。我没有下载成功。
- 有人说是网站权限不够,这个我也没有成功下载。
- 通过修改电脑
host
,这个我也没有成功 - 在
github
下载语料,这个成功了
解决办法
【1】下载语料
网站: https://github.com/nltk/nltk_data/tree/gh-pages
在网站按以下目录找到需要的目录,比如我要找stopwords
找到语料库点进去下载(下载可能很慢,只要自行找一下加速插件就可以快速下载了)
【2】放置语料
首先在python控制台或在其他地方打印nltk
语料库地址
import nltk
nltk.find('.')
# print(nltk.find('.'))
- 1
- 2
- 3
由于我是已经放置好语料了,所以只显示一个地址
如果没有放置过语料,会显示多个地址,把语料放置在其中一个目录下即可
在文件管理器中找到相应目录(注意不是直接放置nltk_data
目录下)
没有corpora就自行创建
要解压放置
测试stopwords
from nltk.corpus import stopwords
stop_words = stopwords.words('english') #选择英文停止词 去重 得到英文停止词表
print(stop_words)
- 1
- 2
- 3
结果