最近入坑python自然语言处理,最重要的工作当然就是配环境了!
包括:python、IDE、NLTK安装
1.python:首先装python,不管装什么软件,我的原则就是装新不装旧(最新版也不太好,容易出bug,所以最好装最新的稳定版),所以我装的3.8.7,不过python3较python2语法有很大改动,书上的很多例子都需要自行debug,所以装python2可能轻松点,看个人选择吧。
安装教程(菜鸟):https://www.runoob.com/python/python-install.html
安装成功后在cmd中输入python查看py版本:
2.IDE: 想做项目肯定得有一个集成开发环境(Integrated Development Environment ),我用的是pycharm,界面风格和IDEA一样,因为是同一个公司开发的。。建项目的流程和IDEA也很像,所以对于java选手应该很友好。其他IDE也有很多不错的,如Vim、Wing等。
详见知乎:https://www.zhihu.com/question/27359349
pycharm的安装教程(转载自博客园):https://www.cnblogs.com/java0011/p/13603696.html
安装好pycharm后,将解释器绑定到刚刚下载的py解释器(为了方便在IDLE中编码),步骤:File->settings->project->Project Interpreter,在红框内选择刚刚下载的python解释器(看路径),如图:
3.NLTK: 最后一个就是py的自然语言处理工具包了,即nltk_data也就是做实验需要的文本数据集。很简单,先安装nltk,即在IDLE中运行:
pip install nltk #安装nltk
import nltk #导入nltk
再将nltk_data文件包下载到指定路径中就行了:
下载链接:https://pan.baidu.com/s/1JeuBy67fl6MOcAJTQhh17g(提取码:cg6y)
然后保存到以下路径之一:
C:\…\nltk_data
C:\nltk_data
D:\nltk_data
E:\nltk_data
(py会在以上路径中寻找nltk_data)
书上的方法有点问题,他在IDLE中运行:
pip install nltk #安装nltk
import nltk #导入nltk
nltk.download() #下载nltk_data
它给的链接需要fq,所以建议按照上述方法自行下载"nltk_data"压缩包。
我保存在D盘根目录:
然后在IDLE中导入我们刚刚下载的数据,即运行:from nltk.book import *
出现以下内容即代表安装成功:
开启我们的NLP的快乐旅程吧!