泛企业搜索PK互联网搜索

[自评]

范企业搜索的要求和erlang以及hadoop的目标是一致的,说明人类在各个领域都进入了对分布式、并行性的需求领域。

原文网址:http://blog.csdn.net/iihero/archive/2009/03/01/3947741.aspx

 

也许,这几年过多的目光关注于互联网搜索,Google,Baidu市值的高涨,让人们对它们倍加关注。其实,搜索,不光是面向公众的互联网搜索。还有专注于企业内的非结构化数据搜索,它同样会面临着海量数据处理的技术问题,还有着其它方面更苛刻的要求,尤其是安全性,面对不同的用户,搜索到的内容是有区别的,甚至涉及到法律问题。而互联网搜索在这方面,几乎没有什么限制。

 

泛企业搜索平台能够在全球性的企业机构中实现跨部门、多操作系统、多语言、多文件类型的自动信息检索、处理和管理。

 

实际的泛企业搜索需求:

能够访问所有数据源和文件类型:现今,企业内部80%的信息是非结构化的,由文字、音频和视频组成。而这类信息需要进行适当处理以满足信息监管需求或充分挖掘利用其真正价值.
语言独立性:许多企业目前都在全球各地开展业务并使用多种语言.
与企业内部所有操作系统的兼容性:企业内部的泛企业搜索平台必须是完全中性的,能够兼容任何操作系统
FRCP一致性:FRCP涉及所有相关的可发现电子存储信息(ESI),无论信息是何种格式或存储于何处。要实现FRCP一致性,泛企业搜索品平台:
需要搜索所有信息存储库
跳出无法执行指令——当搜索引擎发现索引库中包含大量搜索结果而停止搜索时用来伪造搜索情况的一种把戏
需要生成可审查的搜索结果——因此所有数据都需要进行充分搜索
需要具备搜索结果保存功能——确保相关的电子存储信息已保存,未发生任何形式的改变或删除
分布性和容错性:对于分布在各地的企业机构来说,搜索平台应尽可能地自动创建并使用本地资源副本。而远程副本应仅在本地系统出现故障时使用,从而建立良好的容错性以支持本地执行并减少资源开销,提供单一、无缝的服务
负载均衡:数据资源应当跨多个服务器进行自动复制,并且用户的搜索需求应在此资源复制的基础上实现负载均衡,以保证平台的搜索性能,降低延迟,并改善用户体验
镜像/故障转移:自动生成多个资源副本以供多个服务器使用。当系统发生故障时,应自动选择初始资源并切换至第二系统,从而提供不间断的搜索服务

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值