nltk.download()下载失败

今天准备理解一下 TF-IDF,于是下载安装nltk包,但是import word_tokenize后使用word_tokenize进行分词,报错:
LookupError:


Resource [93mpunkt[0m not found.
Please use the NLTK Downloader to obtain the resource:
nltk.download(‘punkt’)
Attempted to load [93mtokenizers/punkt/english.pickle[0m
Searched in:
- ‘C:\Users\Administrator/nltk_data’
- ‘D:\Python3.6\nltk_data’
- ‘D:\Python3.6\share\nltk_data’
- ‘D:\Python3.6\lib\nltk_data’
- ‘C:\Users\Administrator\AppData\Roaming\nltk_data’
- ‘C:\nltk_data’
- ‘D:\nltk_data’
- ‘E:\nltk_data’
- ‘’


意思应该是需要 nltk.download(‘punkt’),于是在Python中运行:
import nltk
nltk.download(‘punkt’)
报错:无法连接。
又试: nltk.download(),but:
在这里插入图片描述

好吧,佛了。
于是,,,去官网直接下载:https://github.com/nltk/nltk_data
在这里插入图片描述
下载packages就好。
放入之前报错中的:
- ‘C:\Users\Administrator/nltk_data’
- ‘D:\Python3.6\nltk_data’
- ‘D:\Python3.6\share\nltk_data’
- ‘D:\Python3.6\lib\nltk_data’
- ‘C:\Users\Administrator\AppData\Roaming\nltk_data’
- ‘C:\nltk_data’
- ‘D:\nltk_data’
- ‘E:\nltk_data’
- ‘’
任一文件夹下就OK,这里需将 packages 重命名成 nltk_data。
然后,,
找到 nltk-data 中 punkt 所在目录:
在这里插入图片描述

这里要进入 punkt.zip 将 punkt 文件拖出来,与 punkt.zip 同级,然后 punkt.zip 就可以删掉啦,于是才大功告成,呼~
再试一下 word_tokenize,木问题啦!
我想,后续如果要用到其他数据文件,类似punkt的处理。

  • 37
    点赞
  • 64
    收藏
    觉得还不错? 一键收藏
  • 16
    评论
nltk是一个用于自然语言处理的Python库。要在Mac上安装nltk,可以按照以下步骤进行操作: 1. 首先,确保你的Mac已经安装了Python。你可以在终端中输入`python --version`来检查Python的版本。 2. 打开终端,输入以下命令来安装nltk库:`pip install nltk` 3. 安装完成后,你可以使用以下命令来验证nltk是否安装成功:`python -m nltk.downloader all` 这个命令将下载nltk所需的所有数据集和资源。下载可能需要一些时间,具体的时间取决于你的网络速度。 4. 下载完成后,你可以使用以下命令来验证nltk是否正常工作: ```python import nltk nltk.download('punkt') from nltk.tokenize import word_tokenize text = "How are you today?" tokens = word_tokenize(text) print(tokens) ``` 运行这段代码后,你应该能够看到分词结果:`['How', 'are', 'you', 'today', '?']` 这表示nltk已经成功安装并且正常工作了。 引用提供了一个在终端中运行nltk的示例,它通过调用`nltk_tagger.py`脚本并传入一个句子参数来进行词性标注。这个示例展示了如何使用nltk对句子进行处理并获得词性标记的结果。 引用提供了一个关于nltk_data的网站链接,你可以访问该链接来获取nltk所需的数据集和资源。 引用提供了一个关于nltk_data数据集下载慢的解决办法,即使用git加速下载,并添加路径以解决找不到对应数据集的问题。 因此,在Mac上安装nltk需要先安装Python,然后使用pip安装nltk库,并通过下载所需的数据集和资源来验证nltk是否正常工作。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [org.lappsgrid.example.python.nltk:Python 包装 NLTK 标记器示例](https://download.csdn.net/download/weixin_42170790/19253626)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] - *2* [nltk.download()下载失败问题解决方法](https://blog.csdn.net/lcf0000/article/details/121849782)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] - *3* [nltk.corpus.conll2002.fileids() LookupError](https://blog.csdn.net/aijava1/article/details/115339840)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 16
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值