nltk.download(‘stopwords‘) 出现 [nltk_data] Error loading stopwords: ＜urlopen error [SSL ... 问题解决方法

最新推荐文章于 2024-05-29 19:57:33 发布

tsuiraku

最新推荐文章于 2024-05-29 19:57:33 发布

阅读量5.8k

点赞数 9

分类专栏： zyx的奇妙问题文章标签： nltk nlp 自然语言处理

本文链接：https://blog.csdn.net/m0_49337600/article/details/109534732

版权

zyx的奇妙问题专栏收录该内容

16 篇文章 0 订阅

订阅专栏

问题：

使用 NLTK 下载语料库的时候遇到如下问题：

import nltk
nltk.download('stopwords')

[nltk_data] Error loading stopwords: <urlopen error [SSL:
[nltk_data]     CERTIFICATE_VERIFY_FAILED] certificate verify failed:
[nltk_data]     unable to get local issuer certificate (_ssl.c:1076)>

False

解决：

方法一，添加如下代码

若无法解决，只能手动下载数据集，参考方法二

import nltk
import ssl

try:
    _create_unverified_https_context = ssl._create_unverified_context
except AttributeError:
    pass
else:
    ssl._create_default_https_context = _create_unverified_https_context
    

nltk.download('stopwords')

方法二，手动下载数据
- 首先，手动下载数据：github （注意，整个文件大小约500m，从github上下载可能会耗费很长时间）
- 第二步，很关键！下载的数据文件名默认为 nltk_data-gh-pages ，现在你需要找到放置的位置。
  
  当你在执行 nltk.downloads('stopwords') 报错时，会出现以下提示
```
Please use the NLTK Downloader to obtain the resource: >>>
nltk.download()
Searched in:
	- '/usr/local/lib/nltk_data'
	- ...
	...
```
  诸如此类路径。我们需要做的是，随便找一个你想要放置数据的文件目录，（注意，当前目录下并没有 nltk_data ），例如我们找到第一个目录 ‘/usr/local/lib/’，在当前目录下面创建 nltk_data。接下来，将下载完毕的数据集文件 nltk_data-gh-pages 解压至当前文件下。你需要进入解压后的文件找到 corpora 文件，（即，在相对路径下 ‘nltk_data-gh-pages/packages/’），将该文件复制到 ‘/usr/local/lib/nltk_data’ 文件下，即可。

tsuiraku

关注

9
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
nltk.download(‘stopwords‘) 出现 [nltk_data] Error loading stopwords: ＜urlopen error [SSL ... 问题解决方法

问题：使用 NLTK 下载语料库的时候遇到如下问题：import nltknltk.download('stopwords')[nltk_data] Error loading stopwords: <urlopen error [SSL:[nltk_data] CERTIFICATE_VERIFY_FAILED] certificate verify failed:[nltk_data] unable to get local issuer certificate (_
复制链接

扫一扫