python解析树_python – NLTK:如何列出解析树的所有相邻子树对(以特定的非终结符号为根)...

如何有效地列出解析树的所有子树对(根据特定的非终结符)?例如,我有以下树:

(S (S (S (S (X (PRO pro))) (X (V v))) (X (ADJ adj))) (X (N n)))

你可以在this link上看到图像.

我想列出符号X的所有相邻实例,扩展到其他符号,i. Ë:

>(X(PRO pro))和(X(V v))

>(X(V v))和(X(ADJ adj))

>(X(ADJ adj))和(X(N n))

最佳答案 这是一个适用于您的示例的解决方案,但可能不适用于您可能遇到的其他树结构:

from itertools import groupby

from nltk.tree import Tree

def get_pairs(t, cat):

pairs = sorted(_get_pairs(t, cat), key=lambda x:x[0])

for is_none, _adjacents in groupby(pairs, lambda x:x[1] is None):

if is_none:

continue

adjacents = list(_adjacents)

for (_, p1), (_, p2) in zip(adjacents, adjacents[1:]):

yield p1, p2

def _get_pairs(t, cat, path=(), idx=(), has_root_cat=False):

if isinstance(t, str):

if has_root_cat:

yield idx, path[:-1] + ((path[-1], t,),)

else:

yield idx, None

return

for i, ch in enumerate(t):

found_cat = has_root_cat or t.node == cat

new_path = path + (t.node,) if found_cat else path

new_idx = idx + (i,)

get_pairs_children = _get_pairs(ch, cat, new_path, new_idx, found_cat)

for pair in get_pairs_children:

yield pair

运行

t = Tree.parse("(S (S (S (S (X (PRO pro))) (X (V v))) (X (ADJ adj))) (X (N n)))")

print list(get_pairs(t, "X"))

给出输出:

[(('X', ('PRO', 'pro')), ('X', ('V', 'v'))),

(('X', ('V', 'v')), ('X', ('ADJ', 'adj'))),

(('X', ('ADJ', 'adj')), ('X', ('N', 'n')))]

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值