基于python的知识融合_知识融合

百香果nlp(nlp.100xg.cn):欢迎提交人工智能(AI)、自然语言处理(NLP)、大数据(big data)、机器学习(ML)、数据挖掘(DM)、知识图谱、智能硬件、工业互联网、工业机器人、云计算、5G网络、物联网、边缘计算(MEC)、机器人流程自动化(RPA)、前沿科技相关的公司、术语、API接口、项目、生成器、解决方案、开放平台产品、ai算法、ai模型、源码、sdk\模块、软件系统、在线/离线工具等领域词条。快速提交,并将在这里展现。

知识融合是在知识图谱获得新知识之后,需要对其进行整合,以消除矛盾和歧义,比如某些实体可能有多种表达,某个特定称谓也许对应于多个不同的实体等。

介绍

知识融合,提取了知识后,由于知识来源广泛,这些知识常常呈现出分散、异构、自治的特点,还有冗余、噪音、不确定、非完备的特征,清洗数据并不能解决这些问题,所以必须对知识进行融合和验证。来自不同知识源的知识在同一框架规范下进行异构数据整合、消歧、加工推理验证、更新等步骤,达到数据、信息、方法、经验以及人的思想融合,形成高质量的知识库。在引入新的知识时,需要判断新知识是否正确,与已有知识是否一致,这里可以用到的证据是权威度、冗余度、多样性、一致性。

实现知识融合,首先基于实体链接技术,将不同来源的同一实体关联起来。例如,在表达雪豹或羚羊这些实体时,表述方式或语音方案会有些许不同,而实体链接的技术,能够把不同来源的实体关联起来。另外,还需要进行属性融合。在抽取出关联好的知识后,将其之间的属性和关系梳理、区分出来,因为同样的表述方式还可能代表了不同实体的意思。

这些属于“知识融合”的第一个层面,一般会交由数据清理等自动化技术执行操作;而第二个层面,则会在自动化技术的处理基础之上,由平台上的行业专家与操作人员进行再度编辑处理与知识融合的操作。最后,再将不同来源的数据融合,得到更为专业且全面的结果。

融合技术

知识图谱可以由任何机构和个人自由构建,其背后的数据来源广泛、质量参差不齐,导致它们之间存在多样性和异构性。语义集成的提出就是为了能够将不同的知识图谱融合为一个统一、一致、简洁的形式,为使用不同知识图谱的应用程序间的交互建立操作性。

常用的技术包括本体匹配(也称为本体映射)、实力匹配(也称为实体对齐、对象公指消解)以及知识融合等。

一个语义集成的常见流程,主要包括:输入、预处理、匹配、知识融合和输出5个环节。

众包学习和主动学习等人机协作方法是目前实例匹配的研究热点。这些方法雇佣普通用户,通过付出较小的人工代价来获得丰富的先验数据,从而提高匹配模型的性能。

随着表示学习技术在诸如图像、视频、语言、自然语言处理等领域的成功,一些研究人员开始着手研究面向知识图谱的表示学习技术,将实体、关系等转换成一个低维空间中的实质向量(即分布式语义表示),并在知识图谱补全、知识库问答等应用中取得了不错的效果。

与此同时,近年来强化学习也取得了一些列进展,如何在语义集成中运用强化学习逐渐成为新的动向。

计算机语言:Java、JavaScript、PHP、Python、C#、Android、Objective-C、Go语言、c/C++、NodeJS、Swift、R语言。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值