关于NLTK中tokenizers的问题

在使用nlkt库进行自然语言处理时遇到下载问题,尝试标准的nltk.download方法未成功,后通过访问github上的nltk_data并根据错误提示下载特定模块,特别是在anaconda环境中创建nltk_data文件夹存储所需包,解决了报错。
摘要由CSDN通过智能技术生成

最近在使用nlkt库进行分词任务和词性还原任务时遇到了一些问题,在这里做一些记录
报错信息
报错信息

解决办法

尝试使用图中所给的:
import nltk
nltk.download
这种方法在我这里不行,报错如下


转点另一种方法,访问github上提供的nltk_data( nltk_data)
这里如果将整个包全部下载下来会很大,比较耗时
在这里插入图片描述
我选择了根据报错,也就是attempted to load后面所跟的路径文件夹进行相对应的下载。

包存放位置

上面报错的信息一般都会给出相应的存放位置。这里我选择的是在anaconda虚拟环境下新建文件夹nltk_data中进行存放,
这里记住图2黄色路径的第一个文件夹名字,根据不同的报错信息,文件名有所不同。贴一张图片
安装在taggers文件夹下面
一般将所有报错的包补充安装好就没问题了

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值