论文笔记整理:谭亦鸣,东南大学博士。
来源:Knowledge and Information Systems volume 62, pages611–637(2020)
链接:https://link.springer.com/article/10.1007/s10115-019-01363-0
概要
本文的核心工作是利用知识结构来衡量知识库的不确定性。文章的内容涵盖了以下几个部分:
1.首先队知识库的知识结构进行介绍;
2.以包含度特征为基础,提出知识结构与知识库之间的依赖以及独立性;
3.研究给定知识库的不确定性度量(并证明该度量方法是以知识库的知识结构为基础);
4.最后,通过实验验证了本文方法的有效性,并从统计学的离散型和相关性两个方面做有效性分析。
动机与思路
作者用自问自答的形式对知识库不确定进行论述:
为何研究知识库不确定性的度量?因为知识库本身具有不确定性。
为何研究知识库的知识结构?因为知识结构有助于从知识库中发现知识。
为何使用知识结构衡量知识库的不确定性?因为很难对比给定知识库的不确定性值(原文是“This is because it is hard to compare the size of measure values of uncertainty for a given knowledge base.”,这句话没看明白,我的理解是:由于不同知识库的实体/关系规模差异较大,直接对知识库做不确定性衡量得到的量化结果不适合(不能够)反映出不同知识库之间的不确定性差异,因此要使用一个高层特征(知识结构),来代表并对不确定性的量化衡量做一个类似归一化的效果。),而且如果获取到两个知识结构之间的依赖关系,可以利用这个关系参与比较知识库之间的不确定性差异。
概念与定义
首先,作者使用矩阵M对于二元关系R进行了如下描述:
我们可以将矩阵中的x理解为知识库中的实体,R表明实体之间的关系,当R(xi, xj) =1时,表明x1,x2之间存在关系R.
可以看到,R在矩阵中可能构成三种关系场景(令实体集合为U,x, y∈U):