zookeeper应用程序

zookeeper为分布式环境提供灵活的协调基础架构。zookeeper框架支持许多当今最好的工业应用程序。我们将在本章中讨论zookeeer的一些最显著的应用。
雅虎
zookeeper框架最初是在"Yahoo!"中构建的。设计良好的分布式应用程序需要满足诸如数据透明度,更好的性能,稳健性,集中配置和协调等要求。所以,他们设计了zookeeper框架来满足这些要求。
Apache Hadoop
Apache Hadoop是大数据行业发展的推动力。Hadoop依靠zookeeper进行配置管理和协调。让我们来了解一下Zookeeper在Hadoop中的作用。
假设Hadoop集群 桥接100个或更多的商品服务器。那么,就需要协调和命名服务。因此涉及大量节点的计算,每个节点需要彼此同步,知道在哪里访问服务器,以及知道如何配置它们。在这个时间点,hadoop集群需要跨节点服务器。zookeeper提供跨节点同步的功能,并确保hadoop项目的任务被序列化和同步化。
多个zookeeper服务器支持大型hadoop集群。每个客户端机器与zookeeper服务器之一通信以检查和更新其同步信息。一些实时示例如下:

  • 人类基因组计划 人类基因组计划包含兆兆字节数据。hadoop mapreduce框架可用于分析数据集并为人类发展找到有趣的事实。
  • 医疗保健 医院可以存储,检查和分析大量患者医疗记录,通常为兆兆字节。
    Apache Hbase
    Apache Hbase是一个开源的,分布式的NoSql数据库,用于大型数据集的实时读/写访问,并在HDFS上运行。HBase遵循主从架构,HBase主控制所有主机。从机称为区域服务器
    HBase分布式应用程序安装取决于运行的Zookeper集群。Apache HBase使用Zookeeper通过集中式配置管理分布式互斥机制来帮助主机和区域服务器跟踪分布式数据的状态。以下是一些HBase的用例。
  • 电信 电信行业存储数十亿条移动通话记录(30TB/月),实时访问这些通话记录成为一项巨大的任务。HBase可以用来实时,轻松,高效地处理所有记录。
  • 社交网络 与电信行业类似,Twitter,LinkedIn和Facebook等网站通过用户创建的帖子接收大量数据。HBase可以用来查找最近的趋势和其它有趣的事实。
    Apache Solr
    Apache Solr是一个用java编写的快速,开源的搜索平台。它是一个快速,容错的分布式搜索引擎。建立在Lucene之上,是一个高性能,全功能的文本搜索引擎。
    Solr 广泛使用Zookeeper的每个功能。如配置管理,leader选举,节点管理,数据锁定和同步化。
    Solr有两个不同的部分,索引搜索。索引是以适当格式存储数据以便后续可以搜索的过程。Solr使用Zookeeper对多个节点中的数据进行索引和搜索。Zookeeper提供以下功能:
  • 根据需要添加或删除节点
  • 在节点之间复制数据,随后最小化数据丢失
  • 在多个节点之间共享数据,随后从多个节点搜索以获得到时候快的搜索结果。
    Apache Solr的一些用例包括电子商务,求职搜索等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值