基于领域本体的语义信息检索研究
(马文虎 南京理工大学信息管理系)
目 录
摘 要:
传统信息检索系统是基于关键字的检索,关键字通常并不能完全表达用户的检索需求。本文首先介绍了信息检索与本体的相关理论,针对目前信息检索存在的问题,从设计思想、系统架构等方面介绍了基于领域本体的语义检索。此外本文还研究了基于领域本体的语义检索的关键技术,并对该课题的研究现状做了深入分析。
关键词:
本体 领域本体 语义检索 信息检索
引言
随着计算机技术以及Internet的迅速发展,人类己经进入了网络信息时代,任何人都可以在互联网上方便的浏览、获取或者提供信息。Internet是海量信息资源库,随着时间的推移,信息量正以爆炸性的速度增长,而且信息的组织是异构的、多元的和分布的,如何准确的在浩如烟海的信息中寻找满足用户查询期望的信息成为信息检索系统所面临的挑战。然而一般的信息检索系统所基于的原理是字符串匹配的方式,在查全率和查准率这两大信息检索系统性能指标上无法取得令人满意的结果[2]。自从本体(Ontology)概念诞生以来,人们开始了对于基于本体的信息检索的尝试,试图利用本体的语义关系来提高检索系统的语义智能,进而提高信息检索系统的查全率和查准率。
1信息检索与本体概述
基于领域本体的语义信息检索,旨在利用本体的丰富的语义关系实现用户查询的语义理解,进而提高信息检索的查全率和查准率。本节将对信息检索理论和本体理论做一概述。
1.1 信息检索
信息检索(Information Retrieval简称IR)通常是将信息按照一定的方式组织和存储起来,并根据用户的需要找出有关的信息的过程和技术[1]。