【博学谷学习记录】超强总结，用心分享|架构师-前置知识-zookeeper基础原理总结

小花样

已于 2022-08-07 23:50:59 修改

阅读量263

点赞数

分类专栏： java 文章标签： zookeeper

于 2022-07-17 00:00:24 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_22043649/article/details/125826605

版权

java 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

文章目录

一、前言
二、zk简介及基础
三、zk应用场景（分布式锁、配置中心、master选举、发布订阅）
四、选举策略

一、前言

本文旨在记录zk重点基础知识点

二、zk简介及基础

2.1 zookeeper是啥？

分布式协调服务

2.2 zookeeper的本质是啥？

本质是文件存储系统+监听（通知）机制

2.3 CAP定理是啥？

cap定理：
C—>consistency 一致性。白话：写入值到集群后，任何读操作都必须返回同一个值；
A—>availability一可用性。白话：任何节点收到请求后，无论成功失败，都必须做出回应；
P—>partiton tolerance分区容错性。白话：不同节点可能会数据不一致（因为同步失败的关系），当不一致时，系统依然能稳定运行。

2.4 zk是cap？ca？cp？

zk是cp模型

2.5 zk的数据节点类型有哪几种？

简单说：持久节点、顺序节点、临时节点
全部类型：
持久
持久顺序
临时
临时顺序
容器
持久 TTL
持久顺序 TTL

2.6 节点属性zxid是什么意思？

事务id：64位数字（前32位是epoch，后32位是事务次数）
值越大，数据同步次数越多，说明值越接近master
eg：0xee41

2.7 为什么原始api用的少？

因为：1、zk的原始api监听只生效一次，所以监听需要反复注册
2、不支持session超时重连

常用curator或zkclient

三、zk应用场景（分布式锁、配置中心、master选举、发布订阅）

3.1 为何用分布式锁？

synchronized是本地锁，只能锁住本地jvm进程中多个线程，对于多个jvm是锁不住的。

1、为了提高效率：防止不同节点做相同的事，浪费资源
2、为了安全：同一时间，只能一个线程去做

3.2 分布式锁常用什么？

分布式锁常用redis和zk，redis：支持并发高，zk：一致性更好

3.3 zk实现分布式锁采用基本思路时，羊群效应是什么意思？

基本思路：
1、某客户端创建临时节点lock
2、其他所有客户端监听该节点
3、锁释放后，事件通知

但会导致一个问题：羊群效应（所有监听的客户端一拥而上抢锁-大量请求，加重了网络负载，影响zk性能）

3.4 升级思路实现zk分布式锁

临时节点改用临时顺序节点
升级思路：
1、所有服务去zk中注册临时顺序节点;
2、判断自己节点是否是最小的那个，最小获取锁;
3、未获取锁的客户端 添加对前一个节点删除事件的监听
4、释放锁/持有锁的客户宕机后，节点被删除；
5、下一个客户端收到通知，重复。

四、选举策略

4.1 zk集群怎么保证数据的一致性？

通过ZAB协议保证，ZAB协议是以Paxos算法为理论基础

ZAB协议有3个角色：
leader：处理事务请求，数据同步
follower：处理非事务请求，具有投票权
observer：处理非事务请求，不具备投票权

4.2 zk啥时候会进入崩溃恢复模式？

zk启动时和leader挂了后
选出新leader，并与过半follower完成数据同步，然后进入消息广播模式

感兴趣自己去看源码 lookForLeader方法逻辑展示了如何选取leader

4.2 选举投票流程？

1、自增选举轮次：首先逻辑时钟都会+1；
2、初始化选票（先清空，再生成选票信息【包括三部分（epoch，zxid，myid）】，初始投给自己）；
然后（第3~第6）互相对比选票信息，先比较epoch值，如相同，则比较zxid，最后比较myid，取值大的当选leader；
3、发送初始化选票；
4、接收外部投票；
5、判断选举轮次；
6、选票PK；
7、统计选票-有过半服务器认可了自己的投票则终止投票
8、更新服务器状态-投票终止后，有过半选票则更新为LEADING，否则更新状态为FOLLOWING

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【博学谷学习记录】超强总结，用心分享|架构师-前置知识-zookeeper基础原理总结

zk基础
复制链接

扫一扫

专栏目录

小花样 CSDN认证博客专家 CSDN认证企业博客

码龄10年

32: 原创

76万+: 周排名

219万+: 总排名

8万+: 访问

: 等级

972: 积分

8: 粉丝

37: 获赞

5: 评论

87: 收藏

私信

关注

热门文章

分类专栏

java 16篇
爬虫 1篇
python 8篇
django 3篇
django rest framework 2篇
shell 1篇

最新评论

多线程requests爬虫小结
真小仙: 逗我玩
celery定时任务重复提交的BUG
北风之神c: 写得赞，博主用心了，但主要还是celery太难用了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字，所以网上的celery博客教程虽然很多，但是并不能学会使用，因为要运行起来需要以下6个方面都掌握好，博客文字很难表达清楚或者没有写全面以下6个方面。 celery消费任务不执行或者报错NotRegistered，与很多方面有关系，如果要别人排错，至少要发以下6方面的截图，因为与一下6点关系很大。 1) 整个项目目录结构,celery的目录结构和任务函数位置，有很大影响 2) @task入参 ,用户有没有主动设置装饰器的入参 name,设置了和没设置有很大不同，建议主动设置这个名字对函数名字和所处位置依赖减小 3) celery的配置，task_queues(在3.xx叫 CELERY_QUEUES )和task_routes (在3.xx叫 task_routes) 4) celery的配置 include （在3.xx叫 CELERY_INCLUDE）或者 imports (3.xx CELERY_IMPORTS) 或者 app.autodiscover_tasks的入参 5) cmd命令行启动参数 --queues= 的值 6) 用户在启动cmd命令行时候，用户所在的文件夹。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。此国产分布式函数调度框架 https://function-scheduling-distributed-framework.readthedocs.io/zh_CN/latest/index.html ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等19个方面全方位超过celery，任何方面都是有过之而无不及。发布性能提高1000%，消费性能提高2000%
深拷贝deepcopy解决list.append(dict)
mosuke0324: 地皮这个比喻好可爱
Django-rest framwork RetrieveModelMixin单个数据查询
孟亚耶: 试了一下怎么不行啊，有详细代码吗

大家在看

青少年编程与数学 01-007 在网页上编写程序 10课题、字符串2_1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。