nltk download所需包

最新推荐文章于 2024-10-12 22:47:22 发布

薛钦亮

最新推荐文章于 2024-10-12 22:47:22 发布

阅读量3.4k

点赞数 4

分类专栏： python从入门到入土文章标签： python 开发语言 nlp nltk

本文链接：https://blog.csdn.net/weixin_43997331/article/details/128018798

版权

python从入门到入土专栏收录该内容

15 篇文章

订阅专栏

本文提供了一种解决nltk库因网络问题无法下载数据的方案。已为大家准备了常用的数据文件，并指导如何将它们放在正确路径下。通过创建并放置punkt、averaged_perceptron_tagger、words和maxent_ne_chunker文件夹，确保nltk能正常工作。测试代码显示了nltk的词法分析和命名实体识别功能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

众所周知，nltk需要download一些文件才能用，但由于网络不通畅，经常下载不下来。官方链接在这里：点击官方链接

我已经帮大家下载好了必备的几个文件，资源在这里，不必担心网络问题，仅需0积分，可以直接下载：
https://download.csdn.net/download/weixin_43997331/87148814

获取nltk允许的数据路径

import nltk
print(nltk.data.path)

然后选择一个路径，作为之后文件存放的位置。

punkt

创建tokenizers文件夹，把下载好的punkt文件夹放进去。

averaged_perceptron_tagger

创建taggers文件夹，把averaged_perceptron_tagger文件夹放进去。

words

创建corpora文件夹，把words文件夹放进去。

maxent_ne_chunker

创建chunkers文件夹，把maxent_ne_chunker文件夹放进去。

测试

全部放好之后就开始测试吧

import nltk
s = 'i have five apples and apple 5th'
s_token = nltk.word_tokenize(s)
s_tagged = nltk.pos_tag(s_token)
s_ner = nltk.chunk.ne_chunk(s_tagged)
print(s_ner)

结果为

(S i/NNS have/VBP five/CD apples/NNS and/CC apple/NN 5th/CD)