知识图谱发展与构建

目录

一 什么是知识图谱

二 知识图谱的相关技术

三 知识图谱的应用行业

四 金融知识图谱的技术框架和体系结构


      知识图谱(Knowledge Graph, KG)是人工智能重要分支,知识工程在大数据环境中的成功应用,知识图谱与大数据和深度学习一起,成为推动互联网和人工智能发展的核心驱动力之一。

        今天周一,花了一整天查阅和了解了知识图谱(knowledge graph), 想到了运用知识图谱解决我的工程问题,但是从我的图片数据中抽取entity和relationship太难了, 信息抽取太难!

        记录一下吧, 放点比较好的资源,大家都来学习知识图谱,下面链接是清华大学计算机科学与技术系教授唐杰率领团队建立的AMiner(有KG年度报告总结和KG最新研究)和北京大学建立的图数据库管理系统(有讲解工程部分,PPT可以下载)。

https://www.aminer.cn/research_report/articlelist?page=1&title=%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1

https://www.bilibili.com/video/BV1iT4y1E7we?from=search&seid=18201555114579424233

下面就贴几张图片,总结今天的学习

一 什么是知识图谱

2012年5月16日, Google发布“知识图谱”的新一代“智能”搜索功能,知识图谱研究热潮高涨

目的:构建知识图谱的目的,就是让机器具备认知能力,理解这个世界

本质:本质上是基于图的语义网络,表示实体和实体之间的关系!

(1)从文本中抽取实体和关系;(2)构建语义网络;(3)分析并从KG网络中获取信息

 

知识图谱:在数据库系统上利用图谱这种抽象载体表示知识这种认知内容

三元组的基本形式:实体1——关系——实体2

                                 实体——属性——属性值

 

二 知识图谱的相关技术

知识图谱研究涉及到的技术有:知识工程构建、数据库操作和管理、自然语言处理和机器学习,下面简单介绍涉及到的技术

1 知识图谱与知识工程

  • 领域本体的构建:面向特定领域的形式化地对于共享概念体系的明确而又详细的说明
  • 知识抽取:从海量的数据中通过信息抽取的方式获取知识
  • 知识融合:通过对多个相关知识图谱的对齐、关联和合并,使其称为一个有机的整体,以提供更全面知识

2 知识图谱数据类型

  • RDF (Resource Description Framework)定义了一个简单的模型,用于描述资源,属性和值之间的关系。资源是可以用URI标识的所有事物,属性是资源的一个特定的方面或特征,值可以是另一个资源,也可以是字符串。总的来说,一个RDF描述就是一个三元组:<主语、谓词、宾语>。
  • RDFs:在RDF数据层的基础上引入模式层,定义类、属性、关系、属性的定义域与值域来描述与约束资源,构建最基本的类层次体系和属性体系,支持简单的上下位推理。
  • 本体语言OWL:进一步扩展RDFS词汇,可声明类间互斥关系、属性的传递性等复杂语义,支持基于本体的自动推理,提供了一组合适web传播的描述逻辑的语法,对机器友好,但认知复杂性限制了工程应用。

3 知识抽取

4 知识融合

5 知识图谱与自然语言处理

自然语言处理和知识图谱研究是双向互动的关系

6 知识图谱与数据管理

  • 知识图谱本质上是多关系图,通常用“实体”来表达图里的结点、用“关系”来表达图里的边。
  • 关系型数据库:实体与实体之间的关系通常都是利用外键来实现,对关系的查询需要大量join操作
  • 图数据库:图模型建模实体(结点)和实体之间的关系(边),在对关系的操作上有更高的性能

7 知识图谱与机器学习

三 知识图谱的应用行业

1 应用领域

2 医疗领域知识图谱

3 医疗知识图谱构建流程

4 医疗知识图谱Schema

四 金融知识图谱的技术框架和体系结构

1 应用

基于企业的基础信息、投资关系、诉讼、失信等多维度关联数据,利用图计算等方法构建科学、严谨的企业风险评估体系,有效规避潜在的经营风险与资金风险

应用:穿透式多层股权查询、资本系查询、风险评估、客户资源分类管理、信贷前期风险评估、采购企业风险审核、招投标企业资质评级等

2 技术框架

3 体系结构

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
构建Python知识图谱是一个有挑战性的任务,涉及到多个方面的知识和技术。下面是一个简单的步骤: 1. 数据收集:收集相关的Python知识数据,包括文档、教程、博客、论文等。你可以使用网络爬虫来收集数据,并将其保存为结构化的形式,如JSON或XML。 2. 数据预处理:对收集到的数据进行预处理,包括文本清洗、标记化、分词等。你可以使用自然语言处理(NLP)技术来处理文本数据。 3. 实体识别:使用命名实体识别(NER)技术来识别文本中的实体,如函数、类、模块等。这可以帮助你建立实体之间的关系。 4. 关系抽取:使用关系抽取技术来提取实体之间的关系。例如,你可以通过分析文本中的句子结构和语义信息来推断函数调用关系、继承关系等。 5. 图谱构建:将实体和关系表示为图结构,并将它们存储在图数据库中。你可以使用图数据库(如Neo4j)来存储和查询图谱数据。 6. 查询接口:为用户提供一个查询接口,使他们可以通过输入问题或关键词来查询知识图谱中的信息。你可以使用自然语言处理和图查询语言来实现查询接口。 7. 持续更新:Python生态系统在不断发展,新的库、框架和技术不断涌现。你需要定期更新你的知识图谱,以反映最新的变化。 总之,构建Python知识图谱是一个复杂的任务,需要综合运用自然语言处理、实体识别、关系抽取和图数据库等技术。通过构建Python知识图谱,你可以更好地组织和管理Python相关的知识,并为用户提供更丰富的学习和查询体验。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值