知识图谱学习笔记九(总结)

从领域知识图谱的几个生命周期来做总结:

1.  知识建模(业务专家参与图谱设计)

       a.  自顶向下(知识体系比较完善的情况)

       b.  自底向上(知识体系欠缺的情况)

       备注:对于一些新兴领域,知识体系不完善,一部分自顶向下构建,一大部分自底向上。

2. 知识存储

       针对构建完成的知识图谱设计底层存储方式,完成各类知识的存储,包括基础属性知识、关联知识、事件知识、时序知识、资源类知识等。

        知识存储解决方案包括单一式存储和混合式存储方式。单一式是指通过三元组、属性表或者垂直分割等方式进行知识存储。三元组存储方式直观但连接查询开销大;属性表基于主语类型划分数据表但不利于缺失属性的查询;垂直分割是指基于谓词进行数据划分但数据表过多,维护与写入操作代价大。

        知识存储介质可以分为原生(Neo4j)和基于现有数据库(mysql、mongo等)。原生存储有比较完善的图查询语言或者算法的支持但不支持定制,灵活度不高,比较复杂节点的极端数据情况表现差;基于现有的数据库可以根据数据特点来进行知识的划分、索引的构建等,自由程度高,但是增加了开发与维护成本。

       备注:综上所述,没有一个统一的可以实现所有类型知识存储的方式,需要根据自身知识的特点选择存储方案,进行存储方案的结合来满足知识的应用需要。

3. 知识抽取

        现有数据分为三类:结构化数据、半结构化数据、非结构化数据。

        针对于结构化数据的知识抽取可以通过直接映射或者映射规则定义等方式。

        针对于半结构化数据的知识抽取通常采用包装器的方式对网站进行解析。(包装器是一个针对于目标数据源中的数据制定了抽取规则的计算机程序)

       针对于非结构化数据的知识抽取难度最大,需要保证抽取的准确率和覆盖率。

4. 知识融合 

        包括两个方面:数据模式层的融合和数据层的融合。

        数据模式层的融合包括概念合并、概念上下位关系合并以及概念的属性定义合并,通过依靠专家人工构建或者从可靠的结构化数据中映射生成。

        数据层的融合包括实体合并、实体属性融合以及冲突检测与解决。

5. 知识计算

        知识计算是领域知识图谱能力输出的主要方式,通过知识图谱本身能力为传统应用形态赋能,提高服务质量和效率。图挖掘计算和知识推理是最具代表性的两种能力。

6. 知识应用

        知识图谱的典型应用包括语义搜索、智能问答以及可视化决策支持。也就是将知识图谱特有的应用形态与领域数据和业务场景相结合。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值