目录
本章首先介绍知识获取相关任务的定义、重要会议及目前的主流方法,然后介绍在工业应用场景下构建电商知识图谱涉及的知识获取任务和采用方法,最后介绍在低资源场景下知识获取任务。
4.1 知识获取概述
知识获取是构建大规模知识图谱的重要环节,是对知识建模定义的知识要素进行实例化的过程,其依据领域知识表示实现从异构多源、多规模数据中获取知识,为后续知识融合、知识推理计算和知识赋能提供知识支撑。
本章会首先介绍知识获取的一些定义、相关子任务以及一些有影响力的国际国内测评会议;然后针对一些比较重要、核心的子任务介绍相关的科学研究进展;
最后针对阿里巴巴电商商品知识图谱,结合阿里巴巴的一个具体业务场景,介绍知识获取在产业界的具体实践和应用。
4.1.1 知识获取相关任务
对于知识获取,通俗的理解是从各种多源异构的数据源中结构化获取各种知识,这里的知识就是指对第2章中知识建模定义的知识要素进行实例化后的数据,而多源异构数据源可以是结构化数据(如链接数据、数据库数据)、半结构化数据(如网页HTML、XML、百科类数据等)及无结构化数据(海量的文本数据,甚至语音、图片数据等)。通过不断的学习实例化知识,持续可靠地扩大知识图谱,建立大规模高质量的知识图谱,是图谱构建过程中的关键技术。
整体而言,知识获取的目标是利用低成本、多源数据构建知识图谱或迭代扩展已有的知识图谱,知识图谱包括实体、实体关系、事件关系和属性关系等。</