错误详情
使用nltk时报错:
···
Searched in:
- 'C:\\<一个路径>/nltk_data'
- 'C:\\<一个路径>\\nltk_data'
- 'C:\\<一个路径>\\nltk_data'
- 'C:\\<一个路径>\\nltk_data'
- 'C:\\<一个路径>\\nltk_data'
- 'C:\\nltk_data'
- 'D:\\nltk_data'
- 'E:\\nltk_data'
···
一长串的报错,最末尾会有一段类似于这样的,发现这些路径下没有nltk_data的文件夹,上网搜索时发现要使用nltk.down()下载数据包,但是下载速度很慢。
解决方法
-
方案1:如果可以科学上网的话,去GitHub下载,下载地址为:https://github.com/nltk/nltk_data
-
方案2:国内用户可以使用gitee码云来下载,下载地址为:https://gitee.com/kiloGrand/nltk_data
解压文件,发现nltk_data下有:
然后再报错给出的路径中,选一个,比如选择D:\nltk_data,那么要做D盘新建一个nltk_data的文件夹
···
Searched in:
- 'C:\\<一个路径>/nltk_data'
- 'C:\\<一个路径>\\nltk_data'
- 'C:\\<一个路径>\\nltk_data'
- 'C:\\<一个路径>\\nltk_data'
- 'C:\\<一个路径>\\nltk_data'
- 'C:\\nltk_data'
- 'D:\\nltk_data'
- 'E:\\nltk_data'
···
现在,把packages文件夹下的所有子文件夹拷贝至nltk_data文件夹里面。请注意,不要把packages拷过去,而是packages的子文件夹。
我这里只拷贝我需要的,如下图所示
最后,将taggers和tokenizers两个文件夹中的压缩文件解压缩。