(1)最简单的方法是
#import nltk
nltk.download()
但是GitHub不太稳定,有时候下载不下来。
(2)直接去https://github.com/nltk/nltk_data/tree/gh-pages 下载,然后把文件放到%appdata%/nltk_data。
(3)去http://www.nltk.org/nltk_data/ 下载,然后放到%appdata%/nltk_data
比如,缺少tokenizers.punkt ,那么久去下载 Punkt Tokenizer Models [ download | source ] ,然后在%appdata%/nltk_data建一个文件夹tokenizers,把punkt放到里面就可以了。