4.实例层的融合与匹配
- 实例匹配和本体匹配有相似之处,但由于实例的数量巨大,因此实例匹配还需要考虑时间复杂度和空间复杂度
4.1实例匹配问题分析
- 空间复杂度挑战:知识图谱匹配中,需要一次性读入内存,并且随后的预处理、匹配计算和映射后的处理也同样需要申请大量的空间才能完成。但只要设计合理的数据结构,并有效利用压缩存储技术,减小空间复杂度带来的负面影响,空间复杂度的挑战是可以解决的。
- 时间复杂度挑战:知识图谱匹配系统的执行时间主要取决于匹配计算的过程,可以通过减少匹配元素对的相似度计算次数,和降低每次相似度计算的时间复杂度来减少执行时间
- 匹配结果质量挑战:在降低匹配方法的时间复杂度和空间复杂度同时,有可能造成匹配结果质量降低。
4.2基于快速相似度计算的实例匹配方法
- 这类方法的思想是尽量降低每次相似度计算的时间复杂度,因此映射过程中只能选择快速简单的匹配器,考虑的映射线索也应该简单些
- 基于快速相似度计算的方法使用的匹配器主要包括文本匹配器、结构匹配器和基于实例的匹配器
- 基于文本匹配的算法相似度很低,但为达到快速计算元素相似度的目的,文本匹配器还应该避免设计复杂的映射线索
- 结构匹配器借助概念层次或者是元素邻居文本的相似性的启发规则计算相似度。例如两个实例的父概念相似那么这两个实例也相似。为避免时间复杂度过高&#x