stanford corenlp使用
编译环境:python 3.8 、win10 64位、jdk1.8及以上
一、下载安装包
1. JDK1.8百度云下载路径:
网盘放的是jdk1.8版本中的1.8.0_152的版本
2.如果大家想下载别的版本,可以去官网:www.oracle.com下载,进入官网页面,然后点击Downloads。
3.将jdk安装完成,环境配置好之后可进行stanfordcorenlp的安装
jdk安装以及环境配置可参考: jdk安装和环境配置
链接:百度云链接
提取码:04lf
二、安装stanfordcorenlp
1. 安装stanfordcorenlp包
pip install stanfordcorenlp
也可使用镜像安装
pip install stanfordcorenlp -i http://pypi.mirrors.ustc.edu.cn/simple/ --trusted-host pypi.mirrors.ustc.edu.cn
2.下载StanfordCoreNlp文件,下载好后解压,可在D盘创建一个文件夹D:\stanford_nlp。
下载Stanford CoreNLP文件。
下载地址:下载地址
3.处理中文文本,需要下载中文模型数据。
下载地址:下载中文模型数据地址
接着,下载中文模型,并将下载好的文件放到StanfordCoreNlp解压后的根目录文件夹中
4.最后,在python中导入stanford corenlp,导入成功,即可成功使用。
from stanfordcorenlp import StanfordCoreNLP
nlp = StanfordCoreNLP('D:/stanford_nlp/stanford-corenlp-4.2.0', lang='zh')
sentence = """
我在陕西省上的大学,毕业之后在上海上班。
"""
#分词
print(nlp.word_tokenize(sentence))
#词性标注
print(nlp.pos_tag(sentence))
#命名实体识别
print(nlp.ner(sentence))