知识图谱入门基础知识(一):构建技术综述

知识图谱入门基础

想shi

目录

01. 基础知识先导

知识图谱技术(knowledge graph)框架{信息抽取层、知识融合层和知识加工层}

  1. 语义网络:以图形的方式向用户返回经过加工和推理的知识
  2. 知识图谱——实现智能化语义搜索的基础和桥梁(对比传统搜索引擎,在人工排查和筛选上更优化——全面掌控信息源)

2012.05.17谷歌发布知识图谱项目【关键技术:从互联网网页中抓取实体及其属性信息,以及实体间的关系】

数据链接(linked data)思想和技术:
  1. URI(uniform resource identifier)
  2. RDF(resource description framework)
  3. OWL(web ontology language)

02.知识图谱的定义

DEF:节后华的语义知识库,用于以符号形式描述物理世界中的概念及相关关系。基本组成单位是“实体-关系-实体”三元组,以及实体及其相关属性-值对。实体之间通过关系相连接,构成网状的知识结构。

03.知识图谱架构

(1)知识图谱的逻辑架构
  1. 数据层:fact类型的知识存储在图数据库
  2. 模式层:知识图谱的核心,存储着经过提炼的知识

通常通过本体库来管理知识图谱——借助本体库对公理、规则和约束条件的支持能力来规范实体、关系以及实体的类型和属性等之间的联系。

(2)知识图谱的体系架构(技术)

在这里插入图片描述

  1. 自底向上构建:从公开采集的数据构建新模式(自动知识抽取和加工技术)
  2. 自顶向下构建:高质量数据中提取本体和模式的信息

从原始数据中提取出知识要素(事实),将其存入知识库的数据层和模式层————信息抽取、知识融合、知识加工

04.信息抽取

信息抽取就是抽取实体、关系和实体属性等
include<实体抽取、关系抽取和属性抽取>
(1)实体抽取(命名实体识别 NER named entity recognition)
实体抽取的质量(准确率和召回率很重要)

【早期】特定行业或特定业务——人名、地名、专有名词
启发式算法和人工编写规则相结合–>机器学习方法–>有监督+规则-
【现在】开放式全网信息抽取——科学完整的命名实体分类体系----{少量语料:迭代扩展实体语料库}———{聚类算法实现识别 关键字自动补全}

(2)关系抽取

(1)需要预先定义实体关系类型(雇佣关系、整体部分关系等等)

【早期】人工构造语法和语义规则————{模式匹配识别关系}
NLP自然语言处理中的语法、句法和语义特征进行实体关系建模
基于特征向量或核函数的有监督学习方法(人工标注大量语料)

(2)面向开放域的信息抽取方法框架(直接利用语料中的关系词汇对实体关系进行建模)

少量人工标记数据作为训练集-->实体关系分类模型-->朴素贝叶斯模型对结果进行三元组识别
then 引入规则
then 引入上下文
(3)属性抽取
实体的属性 as {人 对应 姓名、性别 etc.}
可以被转化为实体关系抽取问题(SVM)
summary:基于语料 | 基于数据结构

05.知识融合

对数据进行清理和整合

include <实体链接 | 实体合并>

2.1 实体链接
将抽取到的对象链接到知识库

def early_days():
	print("基于相似度计算")

在这里插入图片描述
(1)实体消歧主要采用聚类法——定义相似度

first : 空间向量模型(周边)(上下文信息损失)
second : 语义模型(奇异值分解技术)(包含一些语义特征 精度更高)
third : 社会网络模型(社会网络分析技术,拓扑距离)
fourth : 百科知识模型(基于知识库)
增量证据挖掘算法

(2)共指消解
多个指称项对应于同一个实体
【其他称呼】

对象对齐(object alignment)
实体匹配(entity matching)
实体同义(entity synonyms)

稍微快点。
但是C4.5居然被用在共指消解,有点意思哦(视为分类问题)

06.知识合并

  • 合并外部知识库(冗余、对应,本体融入)
    • 步骤:实体匹配、知识评估(赋予新知识可信值)
  • 合并关系数据库:RDF三元组数据

07.知识加工

include <本体构建 | 知识推理 | 质量评估>

本体 = 共享 = 概念模板 (模式层)
{ways:领域专家 and 众包}

08.知识推理

include<基于图的推理 | 基于逻辑的推理>
基于逻辑的推理
  • 一阶谓词逻辑{个体individual+谓词predication}
  • 描述逻辑
  • 基于规则的推理
基于图的推理
  • 神经网络模型
  • path ranking(随机游走,有路就是缘)

09.质量评估

10.知识更新

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值