杨玉基,许斌,胡家威,仝美涵,张鹏,郑莉.一种准确高效的领域知识图谱构建方法.软件学报,2018,29(10).
关键词:
semantic web; knowledge graph; ontology; semantic annotation; entity set expansion; relation extraction
概括:
地理学科知识图谱构建之“四步法”(笔记以此展开分析)。
- 本体构建
- 众包半自动语义标注
- 外源数据补全
- 信息抽取
问题:
如何协调准确率和效率,平衡自动化方法和人工参与,高效构建出准确的知识图谱。
贡献:
- 提出“四步法”并验证有效性;
- 构建地理学科知识图谱;
- 众包半自动语义标注工具可用于完善本体结构
结论与建议:
- 众包半自动语义标注通过标注审核的方式协同标注,提高效率的同时,保证了准确率。经地理学科专家检查,标注数据的知识覆盖率和知识准确率均达到了 99%以上。
- 外源数据的准确率和效率都很高,因为外部数据源的准确率高,结构较好,易处理。
- 实体集扩充和关系抽取会引入错误的数据,因此为了保证知识图谱的高质量,需要对这些数据需要进行人工审核纠正。
- 综合上述,地理学科知识图谱准确率是较高的,由于引入了人工审核纠正,效率有所下降但是可以接受。
- 本方法的适用领域是对知识覆盖率和召回率要求较高的领域。如果对知识覆盖率和召回率要求不严格的领域,可以考虑将众包语义标注替换为信息抽取和人工审核结合的方法来得到核心标注数据,同时降低时间和人力成本。
笔记目录: