强大的大数据全文索引解决方案-ClouderaSearch

介绍

ClouderaSearch带来了全文索引,实时查询和针对CDH和你的企业级数据中心的扩展、灵活性的索引服务。由Apache Hadoop和Apache Solr提供,是企业级的开源搜索。Cloudera Search带来了扩展性和可靠性的新一代集成,多个工作任务的搜索。通过它与CDH独特的整合,Cloudera Search获得了同样的容错性,扩展性,可见性,安全性,以及灵活性的提供其他企业级数据中心的工作。

 

关键特征:

l  全文索引和小面(faceted,与solr一样)导航,基于Hadoop和HBase中的内容

l  可以基于MapReduce实现批量索引。

l  通过GO-LIVE对动态索(Dynamic index)引进行更新

l  针对实时查询,集成了Flume和Lily HBase indexer。

l  无模式(Schema-less)和动态字段的支持,使schema管理更简单

l  针对hadoop优化的字段格式做了“开箱即可用”(Out-of-the-box)字段的提取

l  多文件(Multi-file)格式的支持和集成能力

l  通过HDFS,实现扩展性和容错性索引存储和访问

l  与Apache Sentry的集成,实现了基于角色,细粒度的权限控制

l  通过使用Morphlines重用了数据配置通过工作量

l  与其他hadoop服务共用了基础设施,资源和数据

l  通过使用Index Aliasing 和 Oozie workflows,使用数据迁移和服务更简单

l  在Hue中有简单,可配置的,基于面(faceted)和全文搜索的UI可以使用

l  所有标准的搜索特征在Solr和SolrCloud中有的

l  跨平台的监控,可见性,资源控制,通过ClouderaManager实现

 

可以想象:Cloudera Search是一个整合了Lily,solr(solr cloud),HBase,Hadoop,Flume等,以及使用ClouderaManager来进行管理的全文索引解决方案。也就是说任何一个人,使用了这个框架,则可以轻松搭建一个与google和百度一样的搜索服务。由此可以看出这个框架的强大之处。准备后续使用了这个框架,再进一步分享一些经验给大家。

参考官网: http://www.cloudera.com/content/cloudera/en/products-and-services/cdh/search.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值