知识图谱小综述

知识图谱是结构化语义知识库,用于描述实体及其关系。文章介绍了信息抽取的实体和关系抽取,包括DeepDive算法,以及知识融合、知识加工、知识更新和存储。知识图谱的应用涵盖智能问答系统和文本情感分析等领域。强调了数据源、信息抽取的挑战和Neo4j数据库在知识存储中的优势。
摘要由CSDN通过智能技术生成

概述

知识图谱,是结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系,通过将数据粒度从document级别降到data级别,聚合大量知识,从而实现知识的快速响应和推理。

在一项任务中,只要有关系分析的需求,知识图谱就“有可能”派的上用场。

将知识图谱理解成多关系图

知识图谱应用的前提是已经构建好了知识图谱

知识图谱的表示

当一个知识图谱拥有属性时,我们可以用属性图(Property Graph)表示。

除了属性图,知识图谱也可以用RDF来表示,它是由很多的三元组(Triples)来组成。

、信息抽取

构建的前提是需要把数据从不同的数据源中抽取出来。对于垂直领域的知识图谱来说,它们的数据源主要来自两种渠道:一种是业务本身的数据,这部分数据通常包含在公司内的数据库表并以结构化的方式存储;另一种是网络上公开、抓取的数据,这些数据通常是以网页的形式存在所以是非结构化的数据。

信息抽取的难点在于处理非结构化数据。

大致由如下的步骤组成:

​ a. 实体命名识别(Name Entity Recognition) 这是一项相对比较成熟的技术,有一些现成的工具可以用来做这件事情。

​ b. 关系抽取(Relation Extraction)

、知识融合

​ a.实体统一(Entity Resolution)比如“NYC”和“New York”表面上是不同的字符串,但其实指的都是纽约这个城市,需要合并。实体统一不仅可以减少实体的种

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值