知识库结构
§1 知识库概述
知识库同知识表示和推理机构成专家系统的三个核心组成部分。知识表示研究如何将专家的知识和经验以一定的结构合乎逻辑地表达出来,而知识库则是研究知识的存贮结构,保证知识的明确性、相容性、简洁性及可维护性。严格地说,知识表示和知识库是分不开的,有何种知识表示,就有基于该种知识表示的知识库结构。
关于知识库的定义,各行各业都根据自己的需要对知识库有着不同的定义,众说纷纭。但对知识库都有一个共同的看法:知识库——特定领域的知识和数据的集合,即强调知识库是一个集合、一个知识和数据的集合,而这些知识和数据又属于一个特定的领域,如:燃气轮机知识领域。
知识库的研究和发展得益于一些概念和技术的集成。这些概念和技术所涉及的主要领域有:数据库技术、形式逻辑和自然语言处理等,数据库技术的发展使得知识库能处理数据共享的问题;形式逻辑使得复杂知识能够向简单事实一样被表示、存贮和推理;自然语言处理方法的研究使得知识库能够处理一些复杂的对象、事件序列和模糊的知识,但知识库并非仅仅是借助于其它领域技术和方法的简单组合,它有着自己的鲜明特点:
1. 明确性 包含两个方面:一是知识库结构的明确性,由于知识库是特定领域的数据和知识的集合,因此,知识库结构应与自己所应用的对象明确地保持一致;二是知识库中知识存贮方式的明确性,即知识不应隐含地存放。
2. 相容性 知识库中的知识必须保持逻辑上的严格一致,同时必须严格遵守事先规定好的某些规范,不能有矛盾性的知识或不合规范的知识存在。
3. 简洁性 即知识库中的知识不应该雷同或冗余,若某一知识能从其它知识演绎而得到,则应该把该知识从知识库中剔除。
4. 可维护性 即知识是可以增加、删除和修改的,这是知识库的功能中的重点和难点。
在本文中,针对燃气轮机特有的知识表示结构,结合关系型数据库的思想,提出了燃气轮机知识库的层次模型 结构。该结构能有效地避免知识冗余,通过知识关联和多级索引机构,极大地提高了知识库的搜索效率。
§2 燃气轮机知识库分类及总体结构
在第三章,讨论了燃气轮机知识的分类及每类知识的表示方法。本文把关于燃气轮机的知识分为两大类:深层知识和浅层知识。其中,深层知识又可分为知识元和关联;浅层知识又分为断言、规则和征兆,如图4-1所示:
图4-1 燃气轮机知识分类
一个设计良好的知识库,除了应具备前面提到的明确性、相容性、简洁性和可维护性外,在结构上还应具备很强的独立性,当根据需要对知识库进行扩充或修改时,而不会影响系统的其他部分。同时,知识库内部也应具有鲜明的结构化、层次化特点,这也是系统可维护性的要求。
因此,将知识毫无区别地混杂在一起存放是不明智的,这样既不便于检索也不便于维护。本文采用的方法是,将如图4-1所示的每一类知识单独存放在不同的知识库中,根据不同类知识之间的依赖关系,构筑其相应知识库之间的结构关系。这样,不仅保证了知识库的结构化、层次化特点,而且知识库结构同知识表示在逻辑上保持一致,使整个系统结构显得完整、紧凑。更重要的是,存取知识库时不必经过格式的转换,提高了系统的效率。
鉴于上述分析,本文采用的知识库分类方式同燃气轮机知识的分类方式一样,给每一类知识都构筑自己的知识库,因此燃气轮机知识库的分类方式如图4-2所示。
观察燃气轮机知识库分类图(图4-2),燃气轮机知识库由11个库组成,如何组织这11个库之间的关系及其内部的结构是本章讨论的重点。浅层知识总是基于结构化原理等深层知识之上,因而在知识库模型中,深层知识库应该在底部,浅层知识库则应该在顶部;深层知识库又包括知识元库和关联库,其中知识元库是基础,它记载和描述了构成任一条燃气轮机知识的最基本元素(系统名,子系统名,对象名,状态描述),关联库则存放着各知识元库中知识元之间的所属关系,关联库的存在以知识元库的存在为前提,因而在深层知识库中,知识元库在底部,关联库在顶部;浅层知识库包括断言库、规则库、征兆库和行动库,由定义3-3和图3-6,断言库事实上表现为各层知识元库根据相应关联而构成的一个四元关系集,也就是说,断言可直接从深层知识库中抽取,同时,断言又是构成规则和征兆的前件和后件的基本元素,因而断言库在深层知识库之上且位于浅层知识库的底部;规则和征兆则是基于断言的产生式结构,故规则库和征兆库位于断言库之上,在浅层知识库的顶部;行动本应属于规则的一个域,为了使规则的描述得到简化,故把行动从规则中分离出来,使其单独构成一个库,因此,行动库是规则库的一个附件。由于行动库存放的只是给用户提供维修措施的一组字符流,不需要特殊的存储结构,因此本文后几节将重点讨论其它几种的知识库结构。
图4-2 燃气轮机知识库分类
鉴于上述分析,本文提出的燃气轮机知识库模型如下:
图4-3 燃气轮机知识库模型
§3 知识元库
如图4-3所示,知识元库包括系统名库、子系统名库、对象名库和状态描述库。这四个库是整个燃气轮机知识库的基础,它记载和描述着燃气轮机所有系统、部件及参数的名称和关于它们可能状态的描述。对应图3-6,就主机系统而言,这四个库事实上分别对应着图中的四层节点集。
考察下述深层知识:
例4-1 主机系统由压气机、燃烧室和涡轮等子系统构成;压气机包括出口温度、出口压力、压比和叶片等对象(参数和部件);燃烧室包括燃油喷射量等对象(参数);涡轮包括轮间温度、平均排气量和静子、密封件等对象(参数和部件)。而每一对象有过高、过低、过大、过小、变形、磨损和断裂等状态描述(异常状态)。
为了能够清晰地从上述知识中抽取各层知识元,不妨把它表示成四层树形结构图的形式:
图4-4 例4-1的图解表示
系统名库对应第一层节点集