自然语言处理NLTK_DATA安装缺少punkt和averaged_perceptron_tagger相关问题

大甜甜甜

已于 2023-03-08 23:16:58 修改

阅读量1k

点赞数 1

文章标签： python 开发语言自然语言处理知识图谱 nlp

于 2023-03-08 17:59:57 首次发布

本文链接：https://blog.csdn.net/weixin_45786713/article/details/129408022

版权

最近做有关知识图谱的毕设，需要对数据进行信息抽取，所以涉及到了命名实体识别，关系抽取等自然语言处理；参考相关资料，用了NLTK库下的方法，安装好了NLTK后，运行命名实体识别的代码：

上手发现会报错类似punkt not found之类的问题，直接在kernel里面download又会有远程连接关闭之类连不上的问题，于是自己下载punkt库或者averaged_perceptron_tagger，下载链接：NLTK Data，但是大概率官网这个链接进不去，有个解决办法，参考这个作者的博文：(19条消息) NLTK ERROR LOADING 问题解决方法(使用nltk下载）_ShiningBlueOcean的博客-CSDN博客随后解压放在报错信息里任一目录下即可，这里注意看报错信息里有一层文件夹tokenizers需要自己加一下，我这里使用的是D:\anaconda\share\nltk_data\tokenizers，大家可以根据自己的情况找到相应位置。