构建概念知识图谱-任务定义:
概念知识图谱的组成:
isA关系、subclassOf关系两种。通常用于本体构建。
概念是认知的基石;概念可以更好的理解自然语言;概念可以用于解释现象
概念的上下位关系:
实体概念通常基于词汇进行表达。
实体与概念,概念与概念之间的关系术语自然语言处理中的语言上下位关系。如A isA B
通常称A是 B的下位词,B是A的上位词。
概念抽取并构建成无环图的过程又被称为Taxonomy
概念抽取的方法:
基于模版抽取;基于百科抽取;基于机器学习
概念抽取的方法-基于模版:
Hearst Patterns:基于固定的句型可以抽取isA关系。
概念抽取的方法-基于百科:
从半结构化数据中获取上下文关系
验证抽取结果。
概念知识验证方法:
互斥概念发现;实体相似度;属性分布相似度;领域规则过滤
概念抽取的方法-基于机器学习:
从大量文本中获取概念知识。
基于序列标注模型;