stanfordcorenlp 的parse()方法返回的是字符串,所以就算拿到了数据,也没发做判断分析。
唯一的解决方案是改源码
首先找到corenlp文件下的parse()方法:
def parse(self, sentence):
r_dict = self._request('pos,parse', sentence)
return [s['parse'] for s in r_dict['sentences']][0]
修改为:
def parse(self, sentence):
r_dict = self._request('pos,parse', sentence)
return [s['tokens'] for s in r_dict['sentences']][0]
返回结果:
[{'index': 1, 'word': '清华', 'originalText': '', 'characterOffsetBegin': 0, 'characterOffsetEnd': 2, 'pos': 'NR'}, {'index': 2, 'word': '大学', 'originalText': '', 'characterOffsetBegin': 2, 'characterOffsetEnd': 4, 'pos': 'NN'}, {'index': 3, 'word': '在', 'originalText': '', 'characterOffsetBegin': 4, 'characterOffsetEnd': 5, 'pos': 'P'}, {'index': 4, 'word': '美丽', 'originalText': '', 'characterOffsetBegin': 5, 'characterOffsetEnd': 7, 'pos': 'VA'}, {'index': 5, 'word': '的', 'originalText': '', 'characterOffsetBegin': 7, 'characterOffsetEnd': 8, 'pos': 'DEC'}, {'index': 6, 'word': '北京', 'originalText': '', 'characterOffsetBegin': 8, 'characterOffsetEnd': 10, 'pos': 'NR'}]
这样就是一个对象集合了,就可以各种取值各种判断计算了