python nltk语料库缺失问题

python nltk语料库缺失问题

问题

最近使用nltk词形还原时报错:
***.······Resource [93mgutenberg[0m not found······.***

在这里插入图片描述

解决

根据意思发现时缺失了一些东西,然后根据提示需要使用nltk.download()进行下载然鹅由于科学上网的原因基本会被墙因此我们需要自己手动下载并进行配置。
通过提示我们可以找到该语料包的下载地址:
NLTK Corpora
如果仍然下载不了,这里提供wordnet百度云:
NLTK wordnet 提取码:x752

接下来就是路径的配置,我们可以选择将语料库加入到默认的路径中:
查看方式:

from nltk import data
print(data.path)

ret
我们可以发现会得到一个列表我么可以通过对列表的操作如 list.append()等去对路径进行自定义配置。
将刚刚下好的文件解压到任意一个路径中,此处应注意直接解压后只有一级wordnet目录,但由于源代码的路径是从corpara下取数据(可查看原文档针对特定包),因此我们需要再建立一级corpara的父目录:
path
最后效果如下:
ret

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值