浅谈CAS在分布式ID生成方案上的应用

转载 2017年06月19日 20:25:01

CAS在一种“分布式ID生成方案”上的应用。

所谓“分布式ID生成方案”,是指在分布式环境下,生成全局唯一ID的方法。

可以利用DB自增键(auto inc id)来生成全局唯一ID,插入一条记录,生成一个ID:

ID

这个方案利用了数据库的单点特性,其优点为:

  • 无需写额外代码
  • 全局唯一
  • 绝对递增
  • 递增ID的步长确定

其不足为:

  • 需要做数据库HA,保证生成ID的高可用
  • 数据库中记录数较多
  • 生成ID的性能,取决于数据库插入性能

优化方案为:

  • 利用双主保证高可用
  • 定期删除数据
  • 增加一层服务,采用批量生成的方式降低数据库的写压力,提升整体性能

增加服务后,DB中只需保存当前最大的ID即可,在服务启动初始化的过程中,首先拉取当前的max-id:

  1. select max_id from T; 

然后批量获取一批ID,放到id-servcie内存里,并将max-id写回数据库:

  1. update T set max_id=200

这样,id-service就拿到了[100, 200]这一批ID,上游在获取ID时,不用每次都插入数据库,而是分配完100个ID后,再修改max-id的值,这样分配ID的整体性能就增加了100倍。

这个方案的优点:

  • 数据库只保存一条记录
  • 性能极大增强

其不足为:

  • 如果id-service重启,可能内存会有一段已经申请的ID没有分配出去,导致ID空洞,当然,这不是一个严重的问题
  • 服务没有做HA,无法保证高可用

优化方案为:

  • 冗余服务,做集群保证高可用

冗余了服务后,多个服务在启动过程中,进行ID批量申请时,可能由于并发导致数据不一致:

  1. select max_id from T; 

如上图所示,两个id-service在启动的过程中,同时拿到了max-id为100。

两个id-service同时对数据库的max-id进行写回:

  1. update T set max_id=200

写回max-id成功后,这两个id-service都以为自己拿到了[100,200]这一批ID,导致集群会生成重复的ID。

问题发生的原因,是并发写回时,没有对max-id的初始值进行比对:

  • id-service1写回max-id=200成功的条件是,max-id必须等于100
  • id-service2写回max-id=200成功的条件是,max-id也必须等于100
  • id-service1写回时,max-id是100,理应写回成功
  • id-service2写回时,max-id已经被改成了200,不应该写回成功

只要实施CAS乐观锁,在写回时对max-id的初始条件进行比对,就能避免数据的不一致,写回SQL由:

  1. update T set max_id=200

升级为:

  1. update T set max_id=200 where max_id=100

这样,id-service2写回时,就会失败:

失败后,id-service2要再次查询max-id:

此时max-id已经变为200,于是id-service2获取到了[200, 300]这一批ID,并将max-id=300写回:

  1. update t set max_id=300 where max_id=200

写回成功。

这种方案的好处是:

  • 能够通过水平扩展的方式,达到分布式ID生成服务的无限性能
  • 使用CAS简洁的保证不会生成重复的ID

其不足为:

  • 由于有多个service,生成的ID 不是绝对递增的,而是趋势递增的

【本文为51CTO专栏作者“58沈剑”原创稿件】

分布式系统唯一ID生成方案

分布式系统唯一ID生成方案汇总 系统唯一ID是我们在设计一个系统的时候常常会遇见的问题,也常常为这个问题而纠结。生成ID的方法有很多,适应不同的场景、需求以及性能要求。所以有些比较复杂的系统...
  • lr131425
  • lr131425
  • 2017年05月03日 10:08
  • 427

分布式ID方案有哪些以及各自的优劣势,我们当如何选择

分布式ID方案有哪些以及各自的优劣势,我们当如何选择作者介绍 段同海,就职于达达基础架构团队,主要参与达达分布式ID生成系统,日志采集系统等中间件研发工作。背景在分布式系统中,经常需要对大量的...
  • hl_java
  • hl_java
  • 2017年11月06日 21:36
  • 364

分布式ID生成器解决方案

一、分布式系统带来ID生成挑战 在复杂的系统中,往往需要对大量的数据如订单,账户进行标识,以一个有意义的有序的序列号来作为全局唯一的ID; 而分布式系统中我们对ID生成器要求又有哪些呢? ...
  • m0_37041378
  • m0_37041378
  • 2017年09月28日 17:02
  • 405

分布式ID生成方案

分布式ID生成方案(分布式数据库) 背景:在互联网应用中,应用需要为每一个用户分配一个id,在使用分布式数据库情况下,已经不能依靠自增主键来生成唯一性id了。。。 根据特定算法生成唯一ID 可重现的i...
  • liu251
  • liu251
  • 2012年10月31日 17:46
  • 6520

在高并发分布式情况下生成唯一标识id

最近看了一个清华博士写的代码,把代码研究了一番,在一些方面深度受益。在这里与大家分享下我对其中一点的分析。 在做项目的时候经常会用id作为唯一标识。 但是当有这样一个需求出现的时候:工程分布式部署,要...
  • dream_coder_21
  • dream_coder_21
  • 2015年04月22日 19:17
  • 6297

分布式 ID 生成策略 —— 听云资深 Java 工程师

本文截取自oschina的一篇讨论文章中“宇智波唐嫣”的发言,如果想查看整个讨论原文的,可访问原文,地址如下:http://www.oschina.net/question/865233_213798...
  • zhu19774279
  • zhu19774279
  • 2015年10月26日 11:04
  • 1760

分布式系统中唯一ID的生成方法

在一个MySQL集群中,想要生成一个数据库的全局Unique ID,要满足以下条件: 保证生成的ID唯一;以后数据在多个node节点之间迁移时,不会受到ID生成方法的限制;生成的ID信息最好...
  • JAVA528416037
  • JAVA528416037
  • 2017年02月25日 11:12
  • 1039

高并发分布式环境中获取全局唯一ID[分布式数据库全局唯一主键生成]

需求说明在过去单机系统中,生成唯一ID比较简单,可以使用mysql的自增主键或者oracle中的sequence, 在现在的大型高并发分布式系统中,以上策略就会有问题了,因为不同的数据库会部署到不同的...
  • fgyibupi
  • fgyibupi
  • 2016年12月26日 11:06
  • 5538

Python图像处理库

Pillow库为Python解释器添加了图像处理功能。它提供广泛的文件格式支持,高效的内部表示,以及相当强大的图像处理功能。 功能特点 图像存档Pillow库是写图像存档和图像批处理应用程...
  • liuyuehui110
  • liuyuehui110
  • 2017年07月06日 23:51
  • 442

SnowFlake 分布式ID生成Java实现

SnowFlake不依赖第三方介质,不像基于ZK,Redis等,每次用完一个区间还得通过网络去获取下一个区间,效率较低,基于SnowFlake的分布式ID生成是目前我见过的最快的   Sn...
  • h254532699
  • h254532699
  • 2017年01月10日 13:18
  • 2453
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:浅谈CAS在分布式ID生成方案上的应用
举报原因:
原因补充:

(最多只允许输入30个字)