win10报错[nltk_data] Error loading punkt: <urlopen error [Errno 11004] [nltk_data] getaddrinfo fai

133 篇文章 10 订阅
106 篇文章 1 订阅

nltk_data下载错误 Error loading stopwords: urlopen error [Errno 11004] 解决办法

[nltk_data] Error loading stopwords: <urlopen error [WinError 10054]

前言

这是由于nltkstopwords语料下载错误,nltk的其他语料下载错误也会出现这个错误。

我尝试了几种方法

  1. 直接在 nltk_data 的官网下载。我没有下载成功。
  2. 有人说是网站权限不够,这个我也没有成功下载。
  3. 通过修改电脑host,这个我也没有成功
  4. github下载语料,这个成功了

解决办法

【1】下载语料

网站: https://github.com/nltk/nltk_data/tree/gh-pages

在网站按以下目录找到需要的目录,比如我要找stopwords

image-20201218185351091

找到语料库点进去下载(下载可能很慢,只要自行找一下加速插件就可以快速下载了)

image-20201218185749839

【2】放置语料

首先在python控制台或在其他地方打印nltk语料库地址

import nltk
nltk.find('.')
# print(nltk.find('.'))

    
    
  • 1
  • 2
  • 3

由于我是已经放置好语料了,所以只显示一个地址

如果没有放置过语料,会显示多个地址,把语料放置在其中一个目录下即可

image-20201218190124191

在文件管理器中找到相应目录(注意不是直接放置nltk_data目录下)

没有corpora就自行创建

要解压放置

image-20201218190606433

测试stopwords

from nltk.corpus import stopwords
stop_words = stopwords.words('english') #选择英文停止词 去重 得到英文停止词表
print(stop_words)

    
    
  • 1
  • 2
  • 3

结果

image-20201218191127859

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值