在自然语言处理中,句法树是比较有用的特征,特别是生成最短依赖路径SDP。
- 首先我们要去官网下载jar包。有多种语言可选,也可以下载完整版。
- 我们下好了之后,解压stanford-parser-full-2018-02-27.zip文件,我们需要其中的如下几个文件:
- stanford-parser-3.9.1-models.jar
- stanford-parser.jar
- 解压stanford-parser-3.9.1-models.jar,找到里面你的edu/stanford/nlp/models/lexparser/chinesePCFG.ser.gz
- 因为这里使用了jar包,需要java1.8环境,如果没有这个环境去安装下。
找到着3个关键文件,就可以解析了。
from nltk.parse import stanford
full_path = u"" #那三个文件的系统全路径目录
self.parser = stanford.StanfordParser(