由于学习的需要,我找到了能够分析中文句子的句法分析器Stanford Parser.
下载地址:http://nlp.stanford.edu/software/lex-parser.shtml#Download
那么,如何把这个工具运用到eclipse中去呢?
第一步:建立一个project,然后把下载下来的压缩包解压,把里面的stanford-parser.jar关联到project中。(我的习惯是在project中建一个lib包,然后把stanford-parser.jar放进去,然后就是【工程名】->右键->properties->java build path->add jars……)
第二步:把解压后的文件夹中的parserDemo.java扔到project中的src文件夹下,如果你第一步做对了,第二步中的parserDemo.java文件是不会报错的。
第三步:把解压后的文件夹中grammer下的englishPCFG.ser.gz扔到project中,其结构如下:
然后把ParserDemo中的
LexicalizedParser lp = new LexicalizedParser("grammar/englishPCFG.ser.gz");这一句修改成LexicalizedParser lp = new LexicalizedParser("englishPCFG.ser.gz");
run一下,看看有没有错。如果没有错。就把stanfordParser工具用到eclipse中去了。
第四步,如何进行中文句法分析呢?
我也没去细看,我的做法是依葫芦画瓢,把parseDemo.java中的
“this is a easy sentence.”改成了“这是一个简单的句子。”,发现也能运行出结果。
欲知后事如何,且听下回分解!