分布式系统中的一些问题

最新推荐文章于 2024-11-03 11:01:20 发布

晴天ti

最新推荐文章于 2024-11-03 11:01:20 发布

阅读量235

点赞数

文章标签： java

本文链接：https://blog.csdn.net/i6588662/article/details/123148545

版权

一. CAP理论，BASE理论?

CAP:

注意：CAP理论就是说在分布式存储系统中，最多只能实现上面的两点。P一定要实现，所以就是CP和AP的权衡。

BASE:

总结：cap是最理想化的,base是对cap的一些理解,更加现实化,是对cap的妥协。

二. 负载均衡算法，类型?

算法:

轮询法；加权轮询法
随机法；加权随机法
源地址哈希法：根据客户端ip地址，通过哈希计算得到一个数值，对服务器列表进行取模，得到的结果就是要访问的服务器的序号。
- 可以保证同一个ip地址的客户，每次请求都会映射到指定的服务器.
最小连接数法：比较灵活和智能，比如A服务器有5个链接，B有3个，C没有链接。下次请求就会进入C服务器。

类型:

三.分布式架构下,session共享有什么方案?

四. 分布式id生成方案?

UUID：时间戳+时钟序列(计数器)+唯一的IEEE机器识别码(比如网卡的MAC地址)
- 对数据库不友好，因为随机不连续。mysql的主键默认使用聚集索引，造成索引不连续
数据库自增：对于数据库集群模型，要设置不同的数据库起始值不同，但是步长(自增几)相同。
Leaf-segment：(美团大众点评的)采用每次获取一个ID区间的方式。
- 比如一次和数据库的交互，就请求到100个id，数据来了直接用。避免每次添加数据都请求一个id，增加了数据库的压力。也是对数据库自增策略的一个优化。
雪花算法(最流行)
- snowflake是Twitter开源的分布式ID生成算法，结果是一个长度为64bit的long型的ID。
- 其核心思想是：41位时间戳+10位机器id+12位序列号+符号位(0)。 12bit作为毫秒内的流水号，就是说每个节点在每毫秒可以产生4096 个ID，并且是趋势递增的。
- 这样适合于Mysql的聚集索引，因为趋势递增。索引的连续性好。
- 缺点：依赖于时间戳，时间戳是根据机器的时间得到的。比如linux中，如果人为的进行时钟回拨，就可能造成id重复。