nltk库和spacy库都是英文自然语言处理常用库,但是配置起来比较麻烦,今天就分享配置方法。
nltk配置
安装nltk库,命令行输入以下命令
pip3 install nltk
有些时候的nltk代码需要语料库才能运行,nltk语料库很庞大,这时候运行下面的python代码,就会下载语料库
import
nltk
nltk
.
download
()
不过经常因为网络问题导致语料库无法下载下来,这时候需要我们手动下载并配置语料库
下载并解压,得到nltkdata文件夹,现在我们要知道nltkdata文件夹应该放置的位置(路径), 运行下面代码即可得到nltk_data在本机中放置的位置
import
nltk
nltk
.
data
.
find
(
"."
)
Run
FileSystemPathPointer
(
'/Users/thunderhit/nltk_data'
)
我们将nltkdata文件夹放到对应的路径(/Users/thunderhit/nltkdata),nltk配置完成~
spacy配置
安装spacy库,命令行输入以下命令
pip3 install spacy
通nltk类似,spacy很多的代码运行时候需要用到训练好的模型,模型列表https://spacy.io/models