小羊学习笔记之我对知识知识图谱的概念、结构、构建的理解

一、概念
之前我所了解的知识图谱是一个树状图,有很多的分支。这是我对知识图谱的第一印象。现在我对知识图谱的理解更加专业:它是显示知识结构关系的一个图形,是揭示实体之间关系的语义网络。它从开始时凌乱无章的对象、信息中提取相同点,归纳总结出它们之间的关系,从而使信息建立联系成为一个体系。从一个对象可以找到与它相关的若干个对象,然后还可以一个关系接着一个关系地继续往下延申。

它最早是为了优化搜索引擎而发明的。有了它,用户输入一个关键词之后,会出现与这个关键词有关联的多个对象,也就是一个延申,用户可以去找到自己最想要的信息;因为有了延申,用户会从延申中找到自己感兴趣的多个事物,因此提高了搜索的深度与广度。现在知识图谱也广泛用于智能问答、个性化推荐等领域。
二、结构
知识图谱的结构,包括知识图谱自身的逻辑结构以及构建知识图谱所采用的技术结构,也称体系结构。
逻辑结构有两种:数据层和模式层。

数据层,知识以事实为单位存储在图数据库,事实用三元组来表示,三元组有表示实体与实体之间关系的“实体-关系-实体”结构,还有表示实体属性情况的“实体-属性-属性值”结构。如:中国-面积-960万平方千米。三元组也是知识单元,是知识图谱节点的基本形式。模式层即使三元组的两种形式,数据按照这种模式储存

这里涉及一个本体库的概念:特定领域中某套概念及其相互关系的形式化表达,通常用本体库管理模式层(这里我还没有弄太明白)
三、构建
我认为知识图谱的技术架构就是它是如何构建的。
它有自上而下和自下而上的构建。
自上而下:先有一套构建模板,再把大量零碎的信息对号入座填充到里面。就像已经给许多小盒子起好了名字,安排好了关系,再向其中填充物件。
自下而上:现有大量凌乱的信息,在它们之中抽取实体,关系与属性,然后根据所获得的决定储存模版与方式。

构建有四个步骤:知识抽取、知识表示、知识融合、知识加工。
知识抽取:
从最原始的数据(结构化、半结构化、非结构化数据)出发,抽取出实体、关系、属性等要素。
知识表达:
将抽取出的要素通过一个模板或者样式表达出来,便于进行处理。
知识融合:
将不同只是可中的数据融合起来形成一个知识库。不同知识库的侧重点不同,知识融合是将这些不同的侧重点结合,通过指代消解,实体消歧,实体链接将侧重点不同的知识合并。
知识加工:
融合过后的表达不同于知识,还需要进行加工处理,才能体系化。
加工的过程,首先需要构建一个本体。就像先构建一个家族一样。然后进行知识推理,在原来形成的网络中再一次寻找额外的联系,建立新关联,拓展丰富知识网络。最后要有一个质量评估,进一步完善知识图谱,提高质量。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值