安装nltk及遇到问题

win10系统+python3.7
一、NLTK简单说明
自然语言工具包(Natural Language Toolkit,NLTK)是一个Python 库,用于识别和标记英语文本中各个词的词性(parts of speech)。这个项目于2000 年创建,经过15 年的发展,由来自世界各地的几十个开发者共同努力维护。
二、安装nltk
NLTK 模块的安装方法和其他Python 模块一样:

pip install nltk

要么从NLTK 网站直接下载安装包进行安装
要么在anaconda里的environment、pycharm等,都可以通过关键词搜索“nltk”安装。
安装完NLTK库的时候,就要开始安装NLTK自带的文本库 nltk_data。两种安装方法:
三、安装nltk_data
第一种:命令窗口输入python或者打开jupyter然后输入

>>>import nltk
 
>>>nltk.download()# 进入downloader下载器进行下载我们需要的文本库
 
>>>nltk.download('punkt')# 下载指定的文本库

回车会打开如下界面
在这里插入图片描述
第二种:手动安装
第一步:下载nltk_data包放到指定目录下面

from nltk.book import *

这些位置均可以
在这里插入图片描述
测试安装成功,依旧输入from nltk.book import *,如下显示则表示成功:
在这里插入图片描述
三、问题处理

  1. nltk download(‘punkt’) 连接尝试失败
    在线安装punkt会报错,连接错误;选择手动自己先下载下来,解压;然后放到python3指定搜索目录之一下面
    包一定放在nltk_data/tokenizers下

  2. getaddrinfo failed
    报错信息
    修改Server Index地址为http://www.nltk.org/nltk_data/,具体参见,然后Refresh找到自己需要的Download
    在这里插入图片描述

  3. 路径问题
    第一种:添加环境变量NLTK_DATA,然后重启python
    第二中:代码中标注data位置

from nltk import data
data.path.append(r"G:\nltk_data")
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

柠檬の夏

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值