Stanfordcorenlp的安装
1:下载安装JDK 1.8及以上版本。
2:下载Stanford CoreNLP文件,解压。
3:处理中文还需要下载中文的模型jar文件,然后放到stanford-corenlp-full-2018-02-27根目录下即可(注意一定要下载这个文件,否则它默认是按英文来处理的,无法处理中文语言)。
使用
Python调用StanfordCoreNLP的使用方法:
使用pip安装stanfordcorenlp
简单使用命令:pip install stanfordcorenlp
在Python环境下调用stanfordcorenlp:
一般建议,实际运用时,通常需要做词性分析的数据集都较大,所以给出以下两种导入数据的方式供参考。
1:测试数据较短时,通常采用直接导入,如:
2:测试数据较大,且数据间规范化程度不够,噪声大,此时需要直接将整个未经处理的数据集直接导入且不影响接下来的数据处理(与原数据一致)。通常采用pandas来读取大数据集(常是.csv格式的),如: