一、下载stanford Parser
Stanford Parser的下载地址:https://nlp.stanford.edu/software/stanford-parser-full-2017-06-09.zip
下载之后解压就ok了。
二、java的安装和配置
首先下载JDK。下载地址:
点击打开链接。
下载之后安装,配置环境变量。
测试是否配置成功。命令行输入:java -version会出现版本信息。命令行输入:javac 会出现javac的用法信息。
三、使用stanford parser 的GUI
在stanford Parser的解压包里点击运行:lexparser-gui.bat文件。会出现如下的界面:
然后load file,这里选择要解析的文件。作为示例,选择data路径下的testsent.txt。
然后load parser,选择stanford-parser-3.8.0-models.jar如下:
这里边有很多训练好的模型可供选择,这里我们选择edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz
然后点击Parse,就会出现如下的结果:
四、python在nltk中使用stanford Parser
代码如下:
#!/usr/bin/env python
# _*_ coding:utf-8 _*_
from nltk.parse import stanford
import os
#添加stanford环境变量,此处需要手动修改,jar包地址为绝对地址。
os.environ["STANFORD_PARSER"] = "E:\software\pythonPacket\stanford-parser-full-2017-06-09\stanford-parser.jar"
os.environ["STANFORD_MODELS"] = "E:\software\pythonPacket\stanford-parser-full-2017-06-09\stanford-parser-3.8.0-models.jar"
#为JAVAHOME添加环境变量
java_path = "C:/Program Files/Java/jdk-9.0.1/bin/java.exe"
os.environ['JAVAHOME'] = java_path
parser = stanford.StanfordParser(model_path="edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz")
t = parser.raw_parse_sents(("the quick brown fox jumps over the lazy dog","the quick grey wolf jumps over the lazy fox"))
for item in t:
print item.next()
结果如下:
参考:http://blog.csdn.net/qq_19670461/article/details/42681551