自然语言处理NLP相对来说,是比较火的方向,分词模型很多,选起来容易眼花缭乱,我最开始使用过结巴分词,简单易用。后来又看到了hanLP,介绍上说,它是用《人民日报》语料库训练的,深得我心,于是拿来用用。
hanLP的git连接:https://github.com/hankcs/HanLP/
hanLP的官网:https://www.hanlp.com/
一、anaconda安装Python3.6
因为hanlp依赖TensorFlow,但TensorFlow不支持Python3.6以上版本,所以我们需要先有一个Python3.6的环境。
但社区版pycharm不支持直接从conda直接创建Python环境,所以干脆直接安装一个anaconda吧!
我们在镜像网址,下载一个版本号吻合的anaconda:
https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
我选择的安装文件是:Anaconda3-5.2.0-Windows-x86_64.exe,适合Python3.6版本。
打开exe,一直next,直到安装,仔细观察进度条,会发现上面有Extract:Python-3.6.5的标识,说明我们安装的这个anaconda是Python3.6的。
安装的过程中,记住安装路径。
安装会比较慢,耐心等待即可。
到后面会提示Install Microsoft VSCode,因为我们使用的是pycharm,所以点击skip就行。
最后点击finsh就行,两个learn的复选框,可以取消勾选。