9.25刷榜结束
任务简介:
实体和关系抽取作为信息抽取的重要子任务,近些年众多学者利用多种技术在该领域开展深入研究。将这些技术应用于医学领域,抽取非结构化和半结构化的医学文本构建成医学知识图谱,可服务于下游子任务。非结构化的医学文本,如医学教材每一个自然段落,临床实践中每种疾病下的主题,电子病历数据中的主诉、现病史、鉴别诊断等,都是由中文自然语言句子或句子集合组成。实体关系抽取是从非结构化医学文本中找出医学实体,并确定实体对关系事实的过程。
任务详情:
给定schema约束集合及句子sentence,其中schema定义了关系Predicate以及其对应的主体Subject和客体Object的类别,例如:
(
“subject_type”:“疾病”,
“predicate”: “药物治疗”,
“object_type”:“药物”
)
(
“subject_type”:“疾病”,
“predicate”: “实验室检查”,
“object_type”:“检查”
)
任务要求参评系统自动地对句子进行分析,输出句子中所有满足schema约束的SPO三元组知识Triples=[(S1, P1, O1), (S2, P2, O2)…]。输入/输出:(1) 输入:schema约束集合及句子sentence
(2) 输出:句子sentence中包含的符合给定schema约束的三元组知识Triples