知识图谱的前世今生

点击上方,选择星标置顶,每天给你送干货

阅读大概需要4分钟

跟随小博主,每天进步一丢丢

作者:PMwei

链接:https://zhuanlan.zhihu.com/p/37057052

本文仅做学术分享,侵删

1 什么是知识图谱?

通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。

知识图谱这个网络具备以下3种特性:

1.1 由节点(Point)和边(Edge)组成

1.2 每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”

1.3 知识图谱是关系的最有效的表示方式

所以,知识图谱本质上就是语义网络,是一种基于图的数据结构;

2 知识图谱能干什么?

先按知识图谱应用的深度主要可以分为两大类:

一是通用知识图谱,通俗讲就是大众版,没有特别深的行业知识及专业内容,一般是解决科普类、常识类等问题。

二是行业知识图谱,通俗讲就是专业版,根据对某个行业或细分领域的深入研究而定制的版本,主要是解决当前行业或细分领域的专业问题。

下面我根据这两大类,分别从知识图谱应用的广度进行介绍:

2.1 通用知识图谱

我们日常见到的都是通用知识图谱,主要应用于面向互联网的搜索、推荐、问答等业务场景;

先列举3个通用知识图谱的案例:

2.1.1、百度知识图谱(tupu.baidu.com/)

2.1.2、搜狗搜索(sogou.com/)

2.1.3、360搜索(so.com)

2.2 行业知识图谱

行业知识图谱指面向特定领域的知识图谱,用户目标对象需要考虑行业中各级别的人员,不同人员对应的操作和业务场景不同,因而需要一定的深度与完备性,行业知识图谱对准确度要求非常高,通常用于辅助各种复杂的分析应用或决策支持,有严格与丰富的数据模式,行业知识图谱中的实体通常属性比较多且具有行业意义

2.2.1、人脉路径查询

基于两个用户之间的关联实体(比如:所在单位、同事、同学、朋友、家人等)找到两者之间的关联路径。

2.2.2、企业社交图谱查询

基于投资、任职、专利、招投标、涉诉关系以目标企业为核心心向外层层扩散,形成一个网络关系图,直观立体展现企业关联。

2.2.3、企业最终控股人查询

基于股权投资关系寻找持股比例最大的股东,最终追溯至自然人或国有资源管理部门。

2.2.4、辅助信贷审核

基于知识图谱数据的统一查询,全面掌握客户信息;避免由于系统、数据孤立、信息不一致造成信用重复使用、信息不完整等问题。

2.2.5、反欺诈之组团骗贷

同一个人利用多个身份去申请贷款,详细见下图:虽然贷款人A、贷款人B、贷款人C之间没有直接的关系,但通过知识图谱可以看出三者之间都共享某一部分信息,存在一定的组团骗贷风险。

还有更多行业案例,画图真的很辛苦,有时间再补充,同时欢迎大家添砖加瓦。


案例补充:

1、企业发展历程时序图(融资)

基于企业知识图谱中的投融资事件发生的时间顺序,记录企业的融资发展历程。

2、竞品分析

电商平台常会用到,两家企业知识路径越相似,竞争关系越紧张。

3、征信系统

根据用户已有信息(例如:教育信息、身份信息、联系方式、担保或被担保人信息)关联多家平台信用记录。


建设一个知识图谱系统,需要包括:知识建模、知识获取、知识融合、知识存储和知识应用5大部分:

1、知识建模:构建多层级知识体系,将抽象的知识、属性、关联联关系等信息,进行定义、组织、管理,转化成现实的数据库。

2、知识获取:将不同来源、不同结构的数据转化成图谱数据,包括结构化数据、半结构化数据(解析)、知识标引、知识推理等,保障数据的有效性和完整性。

3、知识融合:将多个来源、重复的知识信息进行融合,包括融合计算、融合计算引擎、手动操作融合等。

4、知识存储:根据业务场景提供合理的知识存储方案,存储方案具备灵活、多样化、可拓展特性。

5、知识应用:为已构建知识图谱提供图谱检索、知识计算、图谱可视化等分析与应用能力。并提供各类知识计算的SDK,包含图谱基础应用类、图结构分析类、图谱语义应用类、自然语言处理类、图数据获取类、图谱统计类、数据集数据获取类、数据集统计类。

下载一:中文版!学习TensorFlow、PyTorch、机器学习、深度学习和数据结构五件套!

后台回复【五件套】
下载二:南大模式识别PPT

后台回复【南大模式识别】

说个正事哈

由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:

(1)点击页面最上方深度学习自然语言处理”,进入公众号主页。

(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。

感谢支持,比心

投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

推荐两个专辑给大家:

专辑 | 李宏毅人类语言处理2020笔记

专辑 | NLP论文解读

专辑 | 情感分析


整理不易,还望给个在看!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值