关于zookeeper的一些知识点

1.zookeeper的过半原则

假设有个服务器id是1-5。

当服务器从1开始启动时会给自己投一票因此1有一票,保持looking状态。

当服务器2启动时,服务器1发现2的id比他大所以把票给到服务器2,服务器2再给自己投票所以有两张票。因为不过半所以保持looking状态。

当服务器3启动时给自己投票的同时,1和2都把票给到服务器三同时因为票数过半1和2的状态改为following服务器3状态改为leading

当服务器4启动时,因1.2.3不是looking状态所以选票结果不变,所以选票结果少数服从多数选票给到服务器3服务器4的状态改为following。

服务器5德状态和服务器4一样票给到3状态改为following。

所以只能是过半才能选出leader半数则不能决定。还有就是集群中只有半数以上服务器启动,集群才能正常工作

2.zookeeper的应用场景

场景1计算大量数据时需要做到1记录状态,2事件通知 ,3可靠稳定的中央调度器,4易上手、管理简单。采用Zookeeper完全可以解决我们的问题,分布式计算中的协调员,观察者,分布式锁  都可以作为zookeeper的关键词,在系统中利用Zookeeper来处理事件通知,队列,优先队列,锁,共享锁等功能,利用这些特色在分布式计算中发挥重要的作用。

场景2,假设我们我们有个20个搜索引擎的服务器和一个总服务器,一个备用的总服务器,一个web向总服务器发出搜索请求.搜索引擎的服务器中的15个服务器现在提供搜索服务,5个服务器正在生成索引.这20个搜索引擎的服务器经常要让正在 提供搜索服务的服务器停止提供服务开始生成索引,或生成索引的服务器已经把索引生成完成可以搜索提供服务了.使用Zookeeper可以保证总服务器自动 感知有多少提供搜索引擎的服务器并向这些服务器发出搜索请求,备用的总服务器宕机时自动启用备用的总服务器,web向总服务器发出搜索请求能够自动地获知总服务器的网络 地址变化。

3.zookeeper的读写原理

因为ZooKeeper集群中所有的server节点都拥有相同的数据,所以读的时候可以在任意一台server节点上,客户端连接到集群中某一节点,读请求,然后直接返回。当然因为ZooKeeper协议的原因(一半以上的server节点都成功写入了数据,这次写请求便算是成功),读数据的时候可能会读到数据不是最新的server节点,所以比较推荐使用watch机制,在数据改变时,及时感应到。

4.flume的主要组件

Flume是一个分布式、可靠、和高可用的海量日志采集、聚和和传输的系统。支持在日志系统中定制各类数据发送方,用于收集数据。同时,Flume提供对数据进行简单处理,并写到各种数据接收方的能力。

   Flume的数据流由事件(Event)贯穿始终。事件是Flume的基本数据单位,它携带日志数据并且携带有头信息,这些Event由Agent外部的Source生成,当Source捕获事件后会进行特定的格式化,然后Source会把事件推入Channel中。可以把Channel看作是一个缓冲区,它将保存事件直到Sink处理完该事件。Sink负责持久化日志或者把事件推向另一个Source。

    Flume运行的核心是Agent。Flume以Agent为最小的独立运行单位。一个agent就是一个JVM。它是一个完整的数据采集工具,含有三个核心组件,分别是Source、Channel、Sink。

5.Memory Channel与File Channel的优点和缺点是什么

File Channel是一个持久化的隧道(channel),他持久化所有的事件,并将其存储到磁盘中。因此,即使Java 虚拟机当掉,或者操作系统崩溃或重启,再或者事件没有在管道中成功地传递到下一个代理(agent),这一切都不会造成数据丢失。Memory Channel是一个不稳定的隧道,其原因是由于它在内存中存储所有事件。如果java进程死掉,任何存储在内存的事件将会丢失。另外,内存的空间收到RAM大小的限制,而File Channel这方面是它的优势,只要磁盘空间足够,它就可以将所有事件数据存储到磁盘上。

6.Flume 日志收集中Spooldir和 Taildir的区别

Spooldir  能够保证数据不丢失,且能够实现断点续传,但延迟较高,不能实时监控。

Taildir  既能够实现断点续传,又可以保证数据不丢失,还能够进行实时监控。

7.网站分析指标PV(page view)、UV(unique visitor)、IP的含义。

PV(page view)  页面的浏览次数,衡量网站用户访问的网页数量;

用户每打开一个页面就记录1次,多次打开同一页面则浏览量累计。

UV(unique visitor) 1天内访问某站点的人数(以cookie为依据);

1天内同一访客的多次访问只计为1个访客。

Ip   指 1天内使用不同ip地址的用户访问网站的数量;

     同一IP不管访问了几个页面,独立IP数均为1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值