安装:
pip install --upgrade LAC==2.1.2
pip install --upgrade paddlepaddle==2.4.0
pip install --upgrade protobuf==3.20.0
pip install --upgrade ddparser==1.0.8
from ddparser import DDParser
ddp = DDParser()
str = '宁肯装作无知而不采取行动'
result = ddp.parse(str)
print(result)
col = ('FROM', 'LEMMA', 'CPOSTAG', 'POSTAG', 'FEATS', 'HEAD', 'DEPREL', 'PROB', 'PDEPREL')
row = []
for res in result:
for i in range(len(res['word'])):
data = {"FROM": res['word'][i], "LEMMA": res['word'][i], "HEAD": res['head'][i], "DEPREL": res['deprel'][i]}
row.append(data)
df = pd.DataFrame(row, columns=col)
df.fillna('_', inplace=True) # 缺省值
df.index = df.index + 1 # 把索引号加1视为ID
print(df)
head 支配词 dependency relation 依存关系 dependent 从属词
箭头的方向由支配词指向从属词
arc.head 表示依存弧的父节点词的索引。ROOT节点的索引是0,第一个词开始的索引依次为1、2、3… arc.relation 表示依存弧的关系。