学长布置了一个在词频统计结果上进一步进行词性筛选(eg.动词筛选)的任务,一开始以为很简单,结果还是遇到了许多情况,这里记录一下NLTK库的安装过程:
1 NLTK库的安装
PyCharm - File - Settings - Project: python处理 - Python Interpreter
没有找到nltk的话可以点 ‘+’ 然后输入nltk安装
2 拓展nltk库
2.1 下载
仅安装nltk库是无法解决词性筛选操作的,需要再下载nltk的扩展包,国外的网站 nltk官网 下载速度较慢,直接给资源:
网盘链接:nltk拓展包
提取码:k6dz
2.2 包的位置
python在调用库时会搜索很多位置,如果找不到会弹出类似以下的错误信息:
**********************************************************************
Searched in:
- 'C:\\Users\\Lenovo/nltk_data'
- 'D:\\python\\nltk_data'
- 'D:\\python\\share\\nltk_data'
- 'D:\\python\\lib\\nltk_data'
- 'C:\\Users\\Lenovo\\AppData\\Roaming\\nltk_data'
- 'C:\\nltk_data'
- 'D:\\nltk_data'
- 'E:\\nltk_data'
**********************************************************************
解决方法:
在2.1打开资源包后,我们进入packages子文件夹,可以看到这些,其中后两个是我们会用到的。(其他的先保留着,之后的任务会用到)
我们把这两个文件里面的子压缩包解压,放到错误信息提示路径的一个子目录下即可。可以参考我的存放位置:
关于NLTK库的应用,如果涉及词频统计的话可以参考我的这篇:【自然语言处理】词性标注
3 参考
[1] nltk_data LookupError: Resource punkt not found. Please use the NLTK Downloader to obtain the resour
[2] nltk扩展包安装问题以及下载很慢的解决办法
[3] NLTK官网