Proposition Bank I (PropBank) 是一个语义角色标注(Semantic Role Labeling, SRL)的数据集。在语义角色标注中,句子中的谓词(通常是动词或形容词)与其相关的论元(arguments)之间的关系被识别并标注出来。这些关系描述了谓词所执行的动作、状态或关系,以及参与这些动作、状态或关系的实体。
PropBank 的主要目标是提供一个全面的、一致的标注框架,用于描述英语句子中谓词的语义角色。在 PropBank 中,每个谓词都被分配了一个或多个语义角色,这些角色描述了谓词与其论元之间的关系。例如,在句子 "John kicked the ball" 中,谓词 "kicked" 被标注了一个施事(agent)角色,其论元是 "John",以及一个受事(patient)角色,其论元是 "the ball"。
PropBank I 是 PropBank 的第一个版本,它主要关注于英语中的动词谓词。随着时间的推移,PropBank 已经扩展到了其他语言,并涵盖了更广泛的谓词类型,包括名词、形容词和介词等。然而,PropBank I 仍然是一个重要的资源,用于研究和评估语义角色标注系统的性能。
使用 PropBank I 进行语义角色标注的研究可以帮助我们更好地理解句子的深层语义结构,这对于许多自然语言处理任务都是非常重要的,如问答系统、信息抽取、机器翻译等。通过标注句子的语义角色,我们可以提取出句子中的关键信息,并将其用于构建更高级的自然语言处理系统。
获取方法:
方法1:注册LDC账号并加入组织获取数据,官网链接:LDC官网
方法2:关注公众号,回复Proposition Bank ILDC语料小助手https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg