知识图谱de构建与应用(四):知识获取

目录

4.1 知识获取概述

4.1.1 知识获取相关任务

4.1.2 知识获取相关测评会议

4.2 命名实体识别

4.2.1 命名实体识别概览

4.2.2 标注体系及常用数据集

4.2.3 基于规则的命名实体识别

4.2.4 基于统计模型的命名实体识别

4.2.5 基于神经网络的实体识别

4.3 实体链接

4.3.1 实体链接概述

4.3.2 候选实体生成

4.3.3 候选实体排序

4.3.4 端到端的实体链接方法

4.4 关系抽取

4.4.1 关系抽取概述

4.4.2 基于模板的关系抽取方法

4.4.3 基于监督学习的关系抽取方法

4.4.4 基于半监督学习的关系抽取方法

4.4.5 基于无监督学习的关系抽取方法

4.5 槽填充与属性补全

4.5.1 槽填充与属性补全概述

4.5.2 基于模板的方法

4.5.3 基于关系分类的方法

4.6 面向半结构化数据的知识获取

4.6.1 百科类网站数据抽取

4.6.2 面向Web网页的知识获取

4.7 低资源条件下知识获取

4.7.1 基于监督学习和弱监督学习的方法

4.7.2 基于迁移学习的方法

4.7.3 基于元学习的方法

4.7.4 基于知识增强的方法

4.8 电商领域知识获取实践

4.8.1 电商知识获取框架

4.8.2 面向场景导购的知识获取示例

4.8.3 低资源商品知识获取示例

4.9 本章小结


本章首先介绍知识获取相关任务的定义、重要会议及目前的主流方法,然后介绍在工业应用场景下构建电商知识图谱涉及的知识获取任务和采用方法,最后介绍在低资源场景下知识获取任务。

4.1 知识获取概述

知识获取是构建大规模知识图谱的重要环节,是对知识建模定义的知识要素进行实例化的过程,其依据领域知识表示实现从异构多源、多规模数据中获取知识,为后续知识融合、知识推理计算和知识赋能提供知识支撑。

本章会首先介绍知识获取的一些定义、相关子任务以及一些有影响力的国际国内测评会议;然后针对一些比较重要、核心的子任务介绍相关的科学研究进展;

最后针对阿里巴巴电商商品知识图谱,结合阿里巴巴的一个具体业务场景,介绍知识获取在产业界的具体实践和应用。

4.1.1 知识获取相关任务

对于知识获取,通俗的理解是从各种多源异构的数据源中结构化获取各种知识,这里的知识就是指对第2章中知识建模定义的知识要素进行实例化后的数据,而多源异构数据源可以是结构化数据(如链接数据、数据库数据)、半结构化数据(如网页HTML、XML、百科类数据等)及无结构化数据(海量的文本数据,甚至语音、图片数据等)。通过不断的学习实例化知识,持续可靠地扩大知识图谱,建立大规模高质量的知识图谱,是图谱构建过程中的关键技术。

整体而言,知识获取的目标是利用低成本、多源数据构建知识图谱或迭代扩展已有的知识图谱,知识图谱包括实体、实体关系、事件关系和属性关系等。</

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值