1、首先我们使用命令pip list
查看是否安装了nltk模块,如果没有,则执行命令pip3 install nltk
进行安装。
2、之后,我们在Jupyter Notebook中进行语料库的安装:
import nltk
nltk.download()
3、弹出下载页面:
4、在弹出的页面上直接download下载速度太慢,此处提供百度网盘下载:
链接:https://pan.baidu.com/s/1c3MFx480tic3KINfJh1RxQ
提取码:gd60
下载完之后将其解压到上图中的Download Directory路径下,如图。
5、点击图1中右下角的Refresh按钮,就会看到很多条目已经变成了绿色(便是已经安装),只有少数是红色,不过影响不大。
6、在Jupyter Notebook中引入该模块运行测试,若无报错则完成。也可在PyCharm中进行测试。
import nltk
from nltk.tokenize import word_tokenize #分词
from nltk.corpus import stopwords #导入语料中的停词表
from nltk.probability import FreqDist