[nltk_data] Error loading stopwords: <urlopen error [Errno 11004] [nltk_data] getaddrinfo failed

出现报错:
ljx
按照提示输入代码:

import nltk
nltk.download('stopwords')

显示:
ljx
解决方法:

  • 简单办法:科学上网之后,再次运行代码。

亲测有效。

  • 不能科学上网:手动去GitHub上下载:

参考教程:
参考教程1
参考教程2

去Git上下载:
https://github.com/nltk/nltk_data/tree/gh-pages
https://github.com/nltk/nltk_data/tree/gh-pages/packages/corpora

找到语料库点进去下载,下载之后放置语料到报错里提到的第一个目录下。

ljx
nltk_data目录下面创建一个corpora文件夹,然后把解压后的数据放进去,记得数据一定要解压,一定要解压。

找不到报错里的路径的可以用下面代码查询路径:

import nltk
nltk.find('.')
#print(nltk.find('.'))

放好之后可以测试一下:

from nltk.corpus import stopwords
stop_words = stopwords.words('english') #选择英文停止词 去重 得到英文停止词表
print(stop_words)

ljx
成功。

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值