windows 下使用stanford parser的方法

最新推荐文章于 2019-10-30 22:53:33 发布

PinkFriday

最新推荐文章于 2019-10-30 22:53:33 发布

阅读量1.7k

点赞数 1

分类专栏：自然语言处理

本文链接：https://blog.csdn.net/PinkFriday/article/details/79003685

版权

自然语言处理专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、下载stanford Parser

Stanford Parser的下载地址：https://nlp.stanford.edu/software/stanford-parser-full-2017-06-09.zip

下载之后解压就ok了。

二、java的安装和配置

首先下载JDK。下载地址: 点击打开链接。

下载之后安装，配置环境变量。

测试是否配置成功。命令行输入：java -version会出现版本信息。命令行输入：javac 会出现javac的用法信息。

三、使用stanford parser 的GUI

在stanford Parser的解压包里点击运行：lexparser-gui.bat文件。会出现如下的界面：

然后load file,这里选择要解析的文件。作为示例，选择data路径下的testsent.txt。

然后load parser,选择stanford-parser-3.8.0-models.jar如下：

这里边有很多训练好的模型可供选择，这里我们选择edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz

然后点击Parse，就会出现如下的结果：

四、python在nltk中使用stanford Parser

代码如下：

#!/usr/bin/env python
# _*_ coding:utf-8 _*_
from nltk.parse import stanford
import os

#添加stanford环境变量,此处需要手动修改，jar包地址为绝对地址。
os.environ["STANFORD_PARSER"] = "E:\software\pythonPacket\stanford-parser-full-2017-06-09\stanford-parser.jar"
os.environ["STANFORD_MODELS"] = "E:\software\pythonPacket\stanford-parser-full-2017-06-09\stanford-parser-3.8.0-models.jar"

#为JAVAHOME添加环境变量
java_path = "C:/Program Files/Java/jdk-9.0.1/bin/java.exe"
os.environ['JAVAHOME'] = java_path

parser = stanford.StanfordParser(model_path="edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz")
t = parser.raw_parse_sents(("the quick brown fox jumps over the lazy dog","the quick grey wolf jumps over the lazy fox"))

for item in t:
    print item.next()

结果如下：