背景
使用 nltk.word_tokenize 包时出现以下报错
详细报错信息为:Resource punkt_tab not found
解决方案
1. 下载 punkt_tab 工具包
1)NLTK DATA 官网下载 (需要科学上网)
网址:https://www.nltk.org/nltk_data/
2)从文章的绑定资源下载(记得解压)
2. 创建文件夹
注意报错内容中,明确说明需要登录 tokenizers\punkt_tab\english 文件夹,并且遍历了一堆你的本机文件夹都没找到。
在其点名会遍历的文件夹中,如果你已有了 tokenizers 文件夹,那就将下载好的 punkt_tab 包拖进就好。
如果你像我一样,所有遍历文件路径中都没有 tokenizers 文件夹,选中一个遍历过的路径,在其下新建 tokenizers 文件夹,再将下载好的 punkt_tab 包拖进,即可正常运行。