nltk.download(‘punkt’)报错问题结果方案
问题描述
import nltk
nltk.download('punkt')
运行这个代码在我这里会出现如下报错,原因不详
[nltk_data] Error loading punkt: <urlopen error [WinError 10054]
[nltk_data] 远程主机强迫关闭了一个现有的连接。>
解决方案
直接到官网下载文件:网址
点击download,在 C:\Users\xxx\AppData\Roaming 路径下创建文件夹 nltk_data,在nltk_data文件夹中再创建文件夹 tokenizers,把下载好的 punkt.zip 解压到 C:\Users\xxx\AppData\Roaming\nltk_data\tokenizers 路径,效果如下:
上述的过程就等价于之前报错的代码了。
检验安装成功
import nltk
text=nltk.word_tokenize("brad pitt, 54 years old , will join as a nonexecutive actor on Nov. 29 .")
print(text)
输出结果:
['brad', 'pitt', ',', '54', 'years', 'old', ',', 'will', 'join', 'as', 'a', 'nonexecutive', 'actor', 'on', 'Nov.', '29', '.']
这就说明已经安装成功了。