离线下载安装NLTK的nltk_data数据包

6 篇文章 0 订阅
1 篇文章 0 订阅

       本来NLTK可以通过简单的nltk.download()下载所需要的文件,但是,这会出现网络问题,非常慢,甚至直接连不上。所以我们需要离线下载nltk_data。

一、下载数据文件

       官方数据在https://github.com/nltk/nltk_data/tree/gh-pages中,不过,在github上下载文件也挺慢的。所以,这里我们可以去码云上找到对应的项目https://gitee.com/qwererer2/nltk_data/tree/gh-pages/(链接如果失效可以在码云自行搜索nltk_data)。 下载得到nltk_data-gh-pages.zip文件。

重点: 别忘了你是把整包都下下来了(我们需要的是其中的package),要把解压出来的文件夹package挪到对应的nltk搜索目录下。并且将packages文件夹重新命名为nltk_data。(我在这里被坑了)

二、将nltk_data文件夹移到对应的目录      

 nltk的搜索路径为:

import nltk
nltk.find('.')

**********************************************************************
Searched in:
- 'C:\\Users\\15839/nltk_data'
- 'E:\\python_env\\nlp\\nltk_data'
- 'E:\\python_env\\nlp\\share\\nltk_data'
- 'E:\\python_env\\nlp\\lib\\nltk_data'
- 'C:\\Users\\15839\\AppData\\Roaming\\nltk_data'
- 'C:\\nltk_data'
- 'D:\\nltk_data'
- 'E:\\nltk_data'
**********************************************************************

将nltk_data文件夹移到上述任意文件路径即可。

下面是我移动之后的文件路径:

三、测试

from nltk.book import *

出现这样的信息表示安装成功了,哈哈。

参考:离线下载安装 NLTK 的 nltk_data 模块

  • 45
    点赞
  • 86
    收藏
    觉得还不错? 一键收藏
  • 14
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值