简介
使用链接中的代码进行“文本-场景图”解析。
解析结果分析
- Sentence: the beautiful girls likes dog. (此句子有语法错误是为了后面的解释)
- entities:一个list,里面包含所有实体目标
- entities[i][‘head’]:被描述的词(名词),去掉了修饰词,如:‘the girls’ -> ‘girls’
- entities[i][‘lemma_head’]:在head的基础上,去掉了单复数,如 : ‘girls’ -> ‘girl’
- entities[i][‘modifiers’]:一个list,包含此head的所有修饰词
- entities[i][‘modifiers’][j][‘dep’]:大概是修饰词的类型吧,不太确定。
- 下图出自CVPR 2018 Visual Question Reasoning on General Dependency Tree
- entities[i][‘modifiers’][j][‘lemma_span’]:去掉了该修饰词?
- entities[i][‘modifiers’][j][‘span’]:string类型,包含完整的修饰词信息。
- entities[i][‘span’]:string类型,包含完整的实体信息,如:‘the beautiful girls’
- entities[i][‘span_bounds’]:一个tuple,完整的实体信息在原句中的wrod index的左右边界
- entities[i][‘type’]:类别信息?我也不知道我输出的东西为啥都是‘unknown’
- relations:一个list,里面包含所有的关系
- relations[i][‘lemma_relation’]:去掉单复数等信息后的relation,如:‘likes’ -> ‘like’
- relations[i][‘object’]:边的终点(讲关系看作场景图中的边)
- relations[i][‘relation’]:原句子中的关系信息,如:'like;
- relations[i][‘subject’]:边的起点(将关系看作场景图中的边)
{'entities': [{'head': 'girls',
'lemma_head': 'girl',
'lemma_span': 'the beautiful girl',
'modifiers': [{'dep': 'det',
'lemma_span': 'the',
'span': 'the'},
{'dep': 'amod',
'lemma_span': 'beautiful',
'span': 'beautiful'}],
'span': 'the beautiful girls',
'span_bounds': (0, 3),
'type': 'unknown'},
{'head': 'dog',
'lemma_head': 'dog',
'lemma_span': 'dog',
'modifiers': [],
'span': 'dog',
'span_bounds': (4, 5),
'type': 'unknown'}],
'relations': [{'lemma_relation': 'like',
'object': 1,
'relation': 'likes',
'subject': 0}]}