领域本体的构建方法研究
(马文虎,南京理工大学信息管理系)
目 录
2.2.2 Skeletal Methodolody骨架法(Uschold方法)... 8
摘 要:
领域本体的构建方法是当前本体研究的热点问题之一。但是,目前领域本体的创建还缺乏系统的、针对所有领域的、工程化的方法。本文介绍了本体的相关理论,并结合领域本体一般构建原则,分析了手工建立本体的六种常见本体构建工程思想,归纳总结出了构建领域本体的一般步骤。此外本文还重点分析了现有的领域本体构建方法以它们及存在的问题。
关键词:
本体 领域本体 构建方法
引言
本体(Ontology)是近年来计算机及相关领域普遍关注的一个研究热点,作为一种能在语义和知识层次上描述信息系统的概念模型建模工具,已被广泛应用于知识工程、系统建模、信息处理、数字图书馆、自然语言理解、语义Web等领域之中[1]。虽然20世纪90年代以来,研究人员从各自的专业角度出发对本体的理论和应用进行了深入研究,取得了丰富的研究成果,本体理论与技术也随之日趋成熟,但是领域本体的建设问题仍然制约这些应用的发展。本文将详细研究和分析目前领域本体构建的各种方法以及存在的问题,为寻找新的构建方法提供参考。
1 本体的相关理论
本体又称为实体,源自于形而上学的哲学分支,它对客观世界的事物进行分解,发现其基本的组成部分,进而研究客观事物的抽象本质[10]。
1.1 本体的概述
本体最早是一个源于哲学的概念,是一种对“存在”的系统化解释,用于描述事务的本质。后来知识工程学者借用了这个概念,在开发知识系统时用于领域知识的获取[8]。
1.1.1 本体的定义
近年来,本体的概念被越来越多的应用于计算机知识工程领域,用于对客观世界的存在进行系统化描述,方便知识的重用和交互。人们已经从不同的角度和方面为本体论概念进行了定义。
虽然不同研究者对本体有不同的描述,但是从内涵上来看,他们都是把本体当作某个领域内不同主体(人、代理、机器等)之间进行交流的一种语义基础,即由本体提供明确定义的词汇表,描述概念和概念之间的关系,作为使用者之间达成的共识[10]。因此,本体的用途包括交流、共享、互操作、重用等。
本体是用于描述一个领域的术语集合,其组织结构是层次结构化的,可以作为一个知识库的骨架和基础。一般认为本体就是Gruber提出的“本体是概念模型的明确的规范说明”。Fensel时这个定义进行分析后认为本体的概念包括概念化、明确、形式化和共享四个主要方面。
总而言之,本体的目标是获取、描述和表示相关领域的知识,提供对该领域知识的共同理解,确定领域内共同认可的词汇,并从不同层次的形式化模式上给出了这些词汇(术语)和词汇间相互关系的明确定义[6]。从而能够描述领域内部甚至更广范围内的一些概念和概念之间的联系,使得这些概念和联系在共享的范围内有着明确唯一的解释,这样人、系统之间就可以进行交流[11]。
一般来说,本体具有两个特征:静态性和动态性—静态性指的是它反映的概念模型,没有涉及动态的行为;动态性指的是它的内容和服务对象是不断变化的,针对不同的领域,可以定义和构造不同的本体[6]。
1.1.2 本体的构成
本体的体系结构应该包括3个要素:核心元素集、元素间的交互作用以及这些元素到规范语义间的映射关系。ISO 704标准和OKBC模型是现有的有关本体体系结构的规定。ISO 704认为本体的体系结构应含概念、定义和术语3部分。ISO 704建议,一个概念应该用一个自然语言的术语得到理想的表达。
对于本体的具体构造过程,可以用以下公式(1-1)形象地表示:
本体 = 概念(Concept) + 属性(Property) + 公理(Axiom) + 取值(Value) + 名义(Nominal) (1-1)[6] |
Perez等人用分类法组织了Ontology,并归纳出本体的五个基本构成元素(建模元语),即:① 类(Classes)或概念(Concepts