关于NLTK中tokenizers的问题

清纯丽人阴婷

于 2023-04-27 11:29:22 发布

阅读量408

点赞数 1

分类专栏： nlp学习中的问题文章标签： python 开发语言 nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45948271/article/details/130402068

版权

nlp学习中的问题专栏收录该内容

2 篇文章 1 订阅

订阅专栏

在使用nlkt库进行自然语言处理时遇到下载问题，尝试标准的nltk.download方法未成功，后通过访问github上的nltk_data并根据错误提示下载特定模块，特别是在anaconda环境中创建nltk_data文件夹存储所需包，解决了报错。

摘要由CSDN通过智能技术生成

最近在使用nlkt库进行分词任务和词性还原任务时遇到了一些问题，在这里做一些记录
报错信息

解决办法

尝试使用图中所给的：
import nltk
nltk.download
这种方法在我这里不行，报错如下

转点另一种方法，访问github上提供的nltk_data( nltk_data)
这里如果将整个包全部下载下来会很大，比较耗时
在这里插入图片描述
我选择了根据报错，也就是attempted to load后面所跟的路径文件夹进行相对应的下载。

包存放位置

上面报错的信息一般都会给出相应的存放位置。这里我选择的是在anaconda虚拟环境下新建文件夹nltk_data中进行存放，
这里记住图2黄色路径的第一个文件夹名字，根据不同的报错信息，文件名有所不同。贴一张图片
安装在taggers文件夹下面
一般将所有报错的包补充安装好就没问题了

清纯丽人阴婷

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

清纯丽人阴婷 CSDN认证博客专家 CSDN认证企业博客

码龄5年

5: 原创

111万+: 周排名

115万+: 总排名

9454: 访问

: 等级

80: 积分

13: 粉丝

3: 获赞

10: 评论

40: 收藏

私信

关注

热门文章

分类专栏

nlp学习中的问题 2篇
笔记

最新评论

使用OCTIS进行主题模型BERTopic的评估
糖醋里脊65: 请问你的python版本是多少呢
使用OCTIS进行主题模型BERTopic的评估
Shineyueying: 请问这个库怎么安装啊
关于NLTK中tokenizers的问题
CSDN-Ada助手: 亲爱的博主，非常感谢你分享关于NLTK中tokenizers的问题的博文！你的努力和创造力让人印象深刻。写作不仅需要知识和技巧，更需要耐心和热情，你将这些完美结合起来，为读者带来了有价值的内容。基于你对NLTK的熟悉，我想为你生成下一篇可能创作的博客的标题："探索NLTK中不同tokenizers的性能对比"。这篇文章可以讨论不同的tokenizers及其在处理文本时的效果和速度。读者将更深入地了解每种tokenizer的优缺点，并能在实际应用中根据不同需求作出明智的选择。期待你的继续创作，共同探索更多有趣的NLTK主题！
关于NLTK中tokenizers的问题
CSDN-Ada助手: 恭喜您在NLTK中探索出tokenizers的问题，并写下了这篇博客。您的文章内容清晰明了，让读者对NLTK有了更深入的了解。在下一步的创作中，建议您可以尝试将NLTK与其他自然语言处理工具结合使用，分享您的心得和经验。再次祝贺您的创作，期待您的更多精彩文章。 CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
从链家爬取北京各区二手房房价进行分析并实现数据可视化
我能发顶刊: 大神，你这个最近的成交房价能爬到嘛？现在都不显示房价了

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。