本人毕业论文是基于本体的关系挖掘求精。之前一直准备考研,等到四月初考研圆满落幕之后才着手毕设。之前一直不知道本体为何物,而且该领域在国内也还不是很成熟,因此参考资料很少,基本上只能通过零星的关键字在国外网站上搜集,收获的资料最终也是全英文版的,看起来相当纠结。在此,记下本人初尝本体的一些感受,与大家分享,不求让人醍醐灌顶,只求抛砖引玉。
入门篇——本体为何物?
接触本体的第一周,感觉本体跟数据库文件差不多,只是多了很多约束。慢慢学下来还是一头雾水,只能简单谈一下自己的理解。本体思想感觉就是面对对象概念中的“抽象——细化”(是这么说的吧),本体就是把论域中所有的东西联系起来,找出共性与差别,以及彼此之间的关系、属类,然后建立一般性的框架(Class、Property),最后再把论域中的东西对应到框架中,即实例化。这些感觉与数据库的确很像,但有一点不一样,数据库等是“Closed World Assumption”,即数据库中没有的肯定不存在;而作为语义载体的本体是“Open World Assumption”,除非明确指出不存在,任何事物都有可能存在,尽管暂时没有在本体中列出。字面上倒是理解二者的差别,但具体有什么用,还有待探索。
个人感觉本体入门最好也是最快的方法就是先下载个Protege软件以及ProtegeOWLTutorial,对照该手册一步不建立Pizza本体,不出一周就能基本掌握建立本体的皮毛以及深化对本体的认识(本体这水太深,不敢造次,仅是皮毛而已……)
最后用我觉得很经典的一个公式来总结一下本体(公式是别人给出的,尊重原创……)
本体 = 概念 + 名义 + 属性 + 取值 + 公理
1) 概念:抽象层次的Class;
2) 名义:概念的名字,是用以传达概念的标识和媒介;
3) 属性:概念之间通过属性相互区别并相互联系;同一类的实例也通过属性值的不同而相互区别。
4) 取值:通常需要对属性的类型、值域等加以限制,以保证属性的有效性;
5) 公理:人们默认已经达成共识且正确的逻辑,是逻辑推理的起点和判断逻辑正确性的依据。