18-一种准确高效的领域知识图谱构建方法

杨玉基,许斌,胡家威,仝美涵,张鹏,郑莉.一种准确高效的领域知识图谱构建方法.软件学报,2018,29(10).

关键词
semantic web; knowledge graph; ontology; semantic annotation; entity set expansion; relation extraction
概括
地理学科知识图谱构建之“四步法”(笔记以此展开分析)。

  1. 本体构建
  2. 众包半自动语义标注
  3. 外源数据补全
  4. 信息抽取

问题
如何协调准确率和效率,平衡自动化方法和人工参与,高效构建出准确的知识图谱。
贡献

  1. 提出“四步法”并验证有效性;
  2. 构建地理学科知识图谱;
  3. 众包半自动语义标注工具可用于完善本体结构

结论与建议

  1. 众包半自动语义标注通过标注审核的方式协同标注,提高效率的同时,保证了准确率。经地理学科专家检查,标注数据的知识覆盖率和知识准确率均达到了 99%以上。
  2. 外源数据的准确率和效率都很高,因为外部数据源的准确率高,结构较好,易处理。
  3. 实体集扩充和关系抽取会引入错误的数据,因此为了保证知识图谱的高质量,需要对这些数据需要进行人工审核纠正。
  4. 综合上述,地理学科知识图谱准确率是较高的,由于引入了人工审核纠正,效率有所下降但是可以接受。
  5. 本方法的适用领域是对知识覆盖率和召回率要求较高的领域。如果对知识覆盖率和召回率要求不严格的领域,可以考虑将众包语义标注替换为信息抽取和人工审核结合的方法来得到核心标注数据,同时降低时间和人力成本。

笔记目录:
在这里插入图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值