PS:本文来自于对《王向前, 张宝隆, 李慧宗. 本体研究综述[J]. 情报杂志, 2016, 35(6):163-170.》文献的学习
1.本体的定义
德国学者Studer等人(1998)认为:“本体是共享概念模型的明确的形式化规范说明”
[1] Studer R, Benjamins V R, Fensel D. Knowledge engineering:principles and methods. Data Knowl Eng 25(1-2):161-197[J]. Data & KnowledgeEngineering, 1998, 25(1-2):161-197.
Studer给出的本体定义被各领域专家学者高度认可,其涵盖了本体的基本特征:共享、明确、概念化、形式化,被学术界广泛引用,对于后来的本体研究具有重要意义。
张秀兰教授通过对国内外各领域本体定义的深入研究,总结出了本体定义:本体是通过描述、捕获领域知识,确定领域内共同认可的概念和概念间的关系,以用于领域内的不同主体之间交流与知识共享的形式化规范说明。[8]张秀兰,蒋 玲.本体概念研究综述[J].情报学报,2007(4):527-531.
对比中外学者关于本体的定义不难发现,国外对本体的研究较为深入,所给出的本体定义比较经典,被学术界广泛引用。而国内关于本体的研究起步较晚,多数学者对本体的研究是在国外学者的基础上进行的,对于本体的定义强调领域概念,是对本体定义的进一步扩展。关于本体定义,学术界一直没有统一的定论,但存在基本的共识,即本体包括:概念化、形式化、可共享、明确、描述领域知识这五大特征。这五大特征基本概括出了本体的实质内容,但随着本体理论和技术的不断拓新和发展以及本体应用的日渐成熟,对于本体的认识会更加清晰,本体定义也将会更加全面准确。
2.本体描述语言
本体作为一种共享的、对概念的形式化描述,需要用事先规定的语言对其进行描述或表示。具有代表性的本体描述语言可以划分为两类:基于谓词逻辑的本体描述语言和基于Web的本体描述语言。第一种的不足之处在于有些概念及概念关系难以用谓词逻辑准确表示,形式化表示具有局限性。基于Web的本体描述语言主要包括XOL、RDFS、SHOE、OIL、DAML+OIL和OWL。XOL是基于XML的本体交换语言,SHOE是简单HTML本体的扩展,这两种语言的形式化基础是框架。RDFS、OIL、DAML+OIL和OWL都是基于RDF的进一步扩充,继承了RDF的语法和表达能力。
随着计算机技术和互联网技术的发展,基于Web的本体描述语言逐渐成为主要本体描述语言。[9] Beniaminov E M, Lapshin V A. Levels of presentingontologies, languages, mathematical models, and ontology web-server project inWeb 2.0[J]. Automatic Documentation & Mathematical Linguistics, 2012,46(2):59-67.以下就基于Web的本体语言进行主要元素和推理机制方面的比较,采用西班牙马德里大学理工分校的评价标准和框架。[10] 李景. 主要本体表示语言的比较研究[J]. 现代图书情报技术, 2005,21(1):1-4.表1表2中,“有”表示描述语言具有此特性,“无”表示描述语言不具有此特性,“可实现”表示无强制要求但是可以实现此特性。
从表1可以看出,这6种语言基本都支持概念、多远关系和实例的定义,XOL、RDFS和SHOE缺乏函数、公理和产生式规则,对领域知识的定义不够完整。OWL和DAML+OIL对各元素基本上都支持,对领域知识的定义较为完备,说明这两种语言具有较强的知识表达能力,而OIL在此方面表现不足。
从表2可以看出,基于Web的本体描述语言多数不具备“出错处理”“过程的执行”和“限制性检验”,但都具备“单调性”“简单继承”“多重继承”。DAML+OIL语言具有大部分特征,