- 编程实现01
- 定义一个句子类NewSentence,包含基本的句子,分词后的结果,以及句法分析树结果,以及句子中的锚点对象(命名实体)
- 分词采用IKAnalyzer
- 句法分析以及依存分析采用stanford parser(分析一个句子比较慢 加载汉语模型要1秒多)
- 结果如下:*
句子“我计划出去旅行。”:
Loading parser from serialized file models/chinesePCFG.ser.gz ... done [1.6 sec].
(ROOT
(IP
(NP (PN 我))
(VP (VV 计划)
(IP
(VP (VV 出去)
(NP (NN 旅行)))))))
Dependency : [nsubj(计划-2, 我-1), root(ROOT-0, 计划-2), ccomp(计划-2, 出去-3), dobj(出去-3, 旅行-4)]
Name Entity : [我, 旅行]句子“曹雪芹写作了红楼梦。”:
Loading parser from serialized file models/chinesePCFG.ser.gz ... done [1.5 sec].
(ROOT
(IP
(NP (NR 曹雪芹))
(VP (VV 写)
(NP (NN 作了) (NN 红楼梦)))))
Dependency : [nsubj(写-2, 曹雪芹-1), root(ROOT-0, 写-2), nn(红楼梦-4, 作了-3), dobj(写-2, 红楼梦-4)]
Name Entity : [曹雪芹, 红楼梦]句子“毛泽东出生于1893年12月26日。”:
Loading parser from serialized file models/chinesePCFG.ser.gz ... done [0.9 sec].
(ROOT
(IP
(NP (NR 毛泽东))
(VP (VV 出生于)
(NP (NT 1893年) (NT 12月) (NT 26日)))))
Dependency : [nsubj(出生于-2, 毛泽东-1), root(ROOT-0, 出生于-2), nn(26日-5, 1893年-3), nn(26日-5, 12月-4), dobj(出生于-2, 26日-5)]
Name Entity : [毛泽东, 1893年12月26日]句子“曹雪芹写了红楼梦。”:
Loading parser from serialized file models/chinesePCFG.ser.gz ... done [2.2 sec].
(ROOT
(FRAG (NR 曹雪芹) (NN 写了) (NR 红楼梦)))
Dependency : [dep(写了-2, 曹雪芹-1), root(ROOT-0, 写了-2), dep(写了-2, 红楼梦-3)]
Name Entity : []
- # 暂时的版本,后续会进行相应的修改