NLTK(www.nltk.org)是在处理预料库、分类文本、分析语言结构等多项操作中最长遇到的包。其收集的大量公开数据集、模型上提供了全面、易用的接口,涵盖了分词、词性标注(Part-Of-Speechtag, POS-tag)、命名实体识别(Named Entity Recognition, NER)、句法分析(Syntactic Parse)等各项 NLP 领域的功能。
使用正常方法下载失败
首先我们会使用此方法安装nltk
pip install NLTK
import nltk
nltk.download()
然后我们就发现安装nltk库安装失败:(如下图)
原因:服务器比较远,我们下载速度会非常慢,在下载中途会因为链接不畅下载失败。
使用此方法下载成功
(1)首先下载安装此版本 Anaconda:
夸克网盘: https://pan.quark.cn/s/d6ff9be74c95
(2)然后下载此版本nltk_data:
夸克网盘: https://pan.quark.cn/s/81cde1ab781b
然后运行此代码:
pip install NLTK
import nltk
nltk.download()
跳出来下面的界面,复制下面Download Directory 的目录地址,一会将nltk_data解压到此目录下面:(界面出现时间不一样,需要耐心等待)
解压到此目录文件夹后截图如下:
录像教程
安装nltk方法
安装成功
import nltk
from nltk.book import *
测试nltk自然语言处理库:
text1.similar("pretty")
text1.similar("that")
text1.concordance(word="danger")