王昊奋知识融合课程笔记

什么是知识融合

目标:融合各层面的知识
合并两个知识图谱(本体),需要确认的是:

  1. 等价实例
  2. 等价类或子类
  3. 等价属性或子属性

实体对齐是知识图谱融合的主要工作

例子:唐三藏(维基百科),玄奘(维基百科),金蝉子(百度百科),这三个实体是一样的

跨语言知识融合

知识在线融合

Google knowledge vault

基本问题:研究怎样将来自多个来源的关于同一个实体或概念的描述信息融合起来。

技术挑战:

  • 数据质量
  • 数据规模

竞赛:OAEI(Ontology Alignment Evaluation Initiative)每年一次

技术

本体对齐,实体匹配

步骤:数据预处理,分块,记录链接,结果评估,结果输出

数据预处理:

  • 语法正规:如联系电话的表示方法,家庭地址的表达方式
  • 数据正规化:如移除空格等,输入错误类,用正式名字替换昵称和缩写等

属性相似度 -> 实体相似度:

  • 聚合:加权平均、手动制定规则、分类器进行监督学习
  • 聚类:层次聚类,相关性聚类、Canopy+K-means
  • 知识表示学习:知识嵌入TransE模型

评估:

  • 准确率、召回率、F1值
  • 运行时间

工具

本体匹配:Falcon-AO
实体匹配:Dedupe,Limes,Silk

案例

zhishi.me
OpenKG中的链接百科

实战

Limes

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值