安装自然语言处理包nltk

本文详细介绍了NLTK库在Python中的安装方法,包括在线和离线安装,并提供了下载和放置nltk_data的步骤。针对下载问题,推荐从国内镜像源获取数据,避免服务器在国外导致的下载困难。在配置过程中,需要将nltk_data移动到Python能够找到的路径下,并解压缩特定的文件以解决运行时的数据找不到问题。最后,文章提供了成功运行的确认方法。
摘要由CSDN通过智能技术生成

nltk官方文档地址:http://www.nltk.org/

按照python依赖包:

pip安装方法: pip install nltk       

离线安装方法:

在这里下载依赖的whl离线包版本:    https://pypi.org/project/nltk/#history

进入离线包文件所在的终端输入命令安装:pip install nltk-3.6-py3-none-any.whl

下载nltk也有两种方式:

(强烈不建议,没安装成功过,服务器在国外,网速慢死而且文件还挺大)

第一种:

python终端命令行下载,进入终端,输入python进入python环境:

输入下面两行代码:

import nltk

nltk.download()         

不使用代理的话不建议这样下载。没有这样安装过,需要这样安装的童鞋自行百度。

第二种:手动在github上下载然后放到相应的文件夹下

数据的github的官网网站为:https://github.com/nltk/nltk_data

为了加速下载可以到国内码云托管平台下载:

注意:这里下载的是github的全部项目,而我们只需要里面的passage文件内容。

 

下载完成后将有用的passage文件夹重命名为nltk_data

之后就是把nltk_data放入到程序能找到的位置就行了。

查看nltk寻找的路径如下:随便允许两行代码:

import nltk
nltk.word_tokenize("A pivot is the pin or the central point on which something balances or turns")

发现报错如下图所示. 其中有相关的数据找不到的问题。

我们将刚刚重命名的nltk_data放入到下面任意一个目录就可以:

    - '/Users/yinchen/nltk_data'
    - '/Users/yinchen/opt/anaconda3/envs/ieltsOralPracticeAppraise/nltk_data'
    - '/Users/yinchen/opt/anaconda3/envs/ieltsOralPracticeAppraise/share/nltk_data'
    - '/Users/yinchen/opt/anaconda3/envs/ieltsOralPracticeAppraise/lib/nltk_data'
    - '/usr/share/nltk_data'
    - '/usr/local/share/nltk_data'
    - '/usr/lib/nltk_data'
    - '/usr/local/lib/nltk_data'
    - ''

结束了吗?当然没有。

移动到这里后发现还是报如下相同数据找不到错误。

 

 为了能够成功运行,还需要最后一步解压操作。通过错误可以发现是punkt数据找不到。nltk_data文件夹下是存在这个zip文件的nltk_data->tokenizers->punkt.zip。我们只需要解压当前文件夹即可。再次运行后程序成功运行。

恭喜!成功运行!!!

 

 

 

参考:https://www.pianshen.com/article/98441100440/ 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值