在网上直接下载别人打包好的全部文件,500多MB,解压之后2.3G,还是不小的,要是直接用 nltk.download() 下到用户文件夹下,还是占用不少C盘空间的。
下好并解压之后,需要让 nltk 能找到我的包(G盘),默认的路径可以按照下面的方法查看:
from nltk import data
data.find('.')
# 返回结果如下
# ...
# LookupError:
# **********************************************************************
# Resource not found.
# Please use the NLTK Downloader to obtain the resource:
#
# >>> import nltk
# >>> nltk.download('')
#
# Attempted to load ./
#
# Searched in:
# - 'C:\\Users\\hustle/nltk_data'
# - 'E:\\Anaconda3\\envs\\NLP\\nltk_data'
# - 'E:\\Anaconda3\\envs\\NLP\\share\\nltk_data'
# - 'E:\\Anaconda3\\envs\\NLP\\lib\\nltk_data'
# - 'C:\\Users\\hustle\\AppData\\Roaming\\nltk_data'
# - 'C:\\nltk_data'
# - 'D:\\nltk_data'
# - 'E:\\nltk_data'
# **********************************************************************
可以看到G盘并不在寻找之列,需要手动添加
我看有些人说给win10添加环境路径不好用,就直接用下面的方法吧
from nltk import data
data.path.append(r"G:\nltk_data")
亲测好用