达梦数据库搜索引擎2009版

企业信息化建设浪潮,催生了大量的内部信息资源。据统计,企业数据每年以200%的速度增长,其中80%的数据以文件、邮件、图片等非结构化数据形式存放在企业内计算机系统中的各个角落,而这些数据总量远远超过了互联网信息的总量。整合企业信息资源,构建企业搜索引擎,为组织内外部用户提供检索和个性化信息服务,已经成为企业信息化的一大热点。
达梦数据库搜索引擎可以解决以下几个问题:
1、信息量大时速度慢的问题
比较常用的数据库有:Oracle、MySQL、MS SQL等,这些都是支持标准sql92语法的数据库,数据库的重点功能在存储,对于数据量达到千万级的时候,再执行sql语法的速度将会变得很慢,特殊是执行含有like的select语句时,比如一个采用mysql存储的客户信息表数据记录达到500万行以上时,就算增加再多的索引,采用标准select语句执行查询时,所需时间至少也在2分钟以上,Oracle数据库虽然可以采用分区,或采用Oracle的内置函数如instr来辅助查询,时间也在1分钟以上。
达梦数据库搜索引擎采用全文检索技术,来解决搜索速度的问题,这就是为什么百度和谷歌能从上亿的网页数据库中搜索,只需零点零几秒以内返回结果。
达梦数据库搜索引擎为什么在检索时能达到零点零几秒返回结果呢?从数据库读取记录,对要搜索的字段分好词,存成文件索引,搜索时再分词,直接去索引查找每个词有哪些索引后文档。

2、信息形式多
如果要建一个行业的信息库,如新闻库,可能就会分很多类别,如:互联网、应用软件、通信等,每类可能由一个部门来组织,并且有可能会涉及到各个部门,不但包括文字、图片、图表和视频等多种形式的信息资源,而且涵盖了其他语言的信息资源。达梦数据库搜索引擎能够提供一个统一的跨媒体检索。

3、信息结构不一样
如果以前有很多信息系统,并且数据库不同,也是用不同语言开发的,查询A信息要去A系统,查询B类信息又要去B系统查询,一是不方便查询,二是重复的数据多,没法充分的利用这些已有的数据资源。
达梦数据库搜索引擎能够针对不同的数据源,采用灵活的定制,将这些数据统一成一个检索库,方便查询,达到数据的充分利用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值