全文检索知识库系统方案 (一)

题记:前段时间做了一个全文检索的知识库系统构建方案的调研,在此分享。

调研方案范围
调研目的在于找到一个在功能和性能上都比较优秀的全文检索的知识库系统实现方案;在调研过程中优先考虑如何实现全文本检索功能,结合考虑系统的功能、性能、以及构建完整系统的效率。
构建全文检索的知识库系统有多种行之有效的方案,主要有以下三种实现思路:
方案A 使用支持全文检索功能的数据库,构建大型文本管理数据库系统,从文件管理数据库出发设计知识库系统;
方案B 使用全文搜索引擎实现全文本检索功能,以此开始设计知识库系统;
方案C 使用WIKI构建知识库系统。
以下分别介绍。
 
1 全文检索数据库方案
支持全文检索的数据库以建立和维护索引的方式对存储在数据库表中的大型文本系统执行有效率的文本搜索。
知识库系统中全文搜索的对象主要是表达知识信息的文章,典型的搜索应用可能是查找出标题或者内容中含有某个搜索项的所有文章。把知识库中的文章存储在按照标题、内容等文本字段建立起来的数据库表中,实现知识库系统中的全文查找也就同数据库中的全文检索功能等同起来了。
Oracle实现全文检索的的组件在Oracle9i中称为Oracle Text。Oracle Text的体系结构如下图, 在本次调研所关注的范围里,这个体系结构的中心是为存储在数据库中的文章的标题、内容等字段信息建立索引。

 
 图一 Oracle Text体系结构 
1.2 DEMO - 使用Oracle数据库实现中文全文检索
目标:确认Oracle Text支持中文全文检索功能、总结操作过程,并探求更好的
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值