from ltp import LTP
ltp=LTP()
seg,hidden=ltp.seg('他叫汤姆去拿外衣。']
dep=ltp.dep(hidden)
print(dep)
输出:
[['他', '叫', '汤姆', '去', '拿', '外衣', '。']]
[
[
(1, 2, 'SBV'),
(2, 0, 'HED'), # 叫 --|HED|--> ROOT
(3, 2, 'DBL'),
(4, 2, 'VOB'),
(5, 4, 'COO'),
(6, 5, 'VOB'),
(7, 2, 'WP')
]
]
以第1、2行为例:
(1, 2, ‘SBV’)
(2, 0, ‘HED’)
依存句法树会有默认的虚拟root节点,索引为0,所以分词后的索引是从1开始的。
即
root:0
他:1
叫:2
汤姆:3
去:4
拿:5
外衣:6
第2行的第二列为0,即代表索引为2的节点(“叫”)的父节点是索引为0的虚拟root节点。
同理,第1行第一列的1就是“他”的索引,2就是“叫”的索引,2(“叫”)是1(“他”)在依存句法树中的父节点,他们的依存关系是‘SBV’(主谓关系),即依存句法树结构如下:
root
|
叫
|
他