python语义网络图_语义网络 (Knowledge Graph)知识图谱

本文介绍了知识图谱的概念,包括它作为结构化数据集的特性,以及实体和关系的表示。重点讲述了知识抽取的步骤,如实体命名识别和关系抽取,以及知识图谱的存储方式,如RDF和图数据库。此外,还讨论了知识图谱的搭建过程,强调业务理解、数据预处理和设计原则。最后,提到了基于规则和概率的上层应用开发,并给出知识图谱在不同行业的应用实例。
摘要由CSDN通过智能技术生成

Author:Liedra

https://www.cnblogs.com/LieDra/

1.本文背景

学习知识图谱时记录的一些内容。当时在搞一些NLP、数据挖掘相关项目。

--------------------------------------------正文开始----------------------------------------------------

2.什么是知识图谱。

知识图谱是由本体(Ontology)作为Schema层,和RDF数据模型兼容的结构化数据集。是语义网络的知识库。

一定程度上可以简单地把知识图谱理解为多关系图。多关系图包含多种不同类型的节点和边。

通常用实体来表达图里的节点,用关系来表达不同实体之间的某种联系。

实体---人、公司、概念、地名等,关系则代表联系(联想数据库)。

3.知识图谱的表示

现实世界中,实体和关系也会拥有自己的属性。

除了属性图,知识图谱也可以用RDF来表示(一般不支持属性,主要用于学术场景)。

4.知识抽取

数据源:主要有两种渠道,一是业务本身的数据,结构化的,二是网络上公开、抓取的数据,非结构化的。前者只需要简单的预处理,后者需要借助自然语言处理等技术提取结构化信息。(结构化和非结构化)

涉及以下几个方面的自然语言处理技术:实体命名识别,关系抽取,实体统一,指代消解。

实体命名识别:从文本中提取出实体并打标签。实体名及实体类型(地点还是其他等等)。相对成熟的技术,有一些工具可用。

关系抽取:如A在B中, A接近C。这里的'在'

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值