集群高并发下如何保证分布式唯一全局id生成?
id生成规则部分硬性要求:
- 全局唯一
- 趋势递增
- 单调递增
- 信息安全
- 含时间戳
id生成系统的可用性要求:
- 高可用
- 低延迟
- 高qps
一般通用方案UUID(只有唯一性)
UUID.randoomUUID().toString()(不推荐)
- 无序,无法预测她的生成顺序,不能生成递增有序的数字
- 主键,id作为主键时再特定的环境会存在一些问题。
- 索引,B+树索引的分裂
小厂使用mysql:唯一性,递增(不适合)
replace into
id自增
分布式里面,数据库的自增id机制的主要原因:数据库自增ID和mysql数据库的replace into实现的。
replace into首先尝试插入数据列表中,如果发现表中已经有此行数据(根据主键或唯一索引判断)则先删除,再插入,否则直接插入新数据
REPLACE INTO的含义是插入一条记录,如果表中唯一索引的值遇到冲突,则替换老数据。
- 系统水平扩展比较困难,比如定义好了步长和机器台数之后,如果要添加机器怎么办?
- 数据库压力很大,每次获取ID都得读写一次数据库,非常影响性能,不符合分布式ID里面的延迟低和要求高QPS的规则(再高并发下,如果都去数据库里面获取id,那是非常影响性能的)
使用redis(高可用设置步长)
可以使用redis集群来获取更高的吞吐量
- 配置麻烦
- 维护啰嗦
为了获取唯一id要配置集群
snowflake(雪花算法)
twitter的分布式自增id算法snowflake
- 经测试snowFlake每秒能够产生26万个自增可排序id
- 生成id能够按照时间有序生成
- snowFlake算法生成的结果是一个64bit大小的整数,为一个Long型(转型成字符串后长度最多19)
- 分布式系统内不会产生id碰撞(由datacenter和workerld做区分)并且效率较高
snowflake组成
1bit符号位+41bit时间戳位+10bit工作进程位+12bit序列号位
1bit:不用,因为二进制中最高位是符号位,1表示负数,0表示正数,id一般为整数,所以固定为0
41bit:时间范围:2的41次方/(3652460*&&60*1000L)=69.73年
10bit:用来记录工作机器id,,5位datacenterId和5位workerId
12bit:用来记录同毫秒内产生的不同id
SnowFlake算法代码
public class SnowflakeIdWorker {
// ==============================Fields==================
/** 开始时间截 (2019-08-06) */
private final long twepoch = 1565020800000L;
/** 机器id所占的位数 */
private final long workerIdBits = 5L;
/** 数据标识id所占的位数 */
private final long datacenterIdBits = 5L;
/** 支持的最大机器id,结果是31 (这个移位算法可以很快的计算出几位二进制数所能表示的最大十进制数) */
private final long maxWorkerId = -1L ^ (-1L << workerIdBits);
/** 支持的最大数据标识id,结果是31 */
private final long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);
/** 序列在id中占的位数 */
private final long sequenceBits = 12L;
/** 机器ID向左移12位 */
private final long workerIdShift = sequenceBits;
/** 数据标识id向左移17位(12+5) */
private final long datacenterIdShift = sequenceBits + workerIdBits;
/** 时间截向左移22位(5+5+12) */
private final long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;
/** 生成序列的掩码,这里为4095 (0b111111111111=0xfff=4095) */
private final long sequenceMask = -1L ^ (-1L << sequenceBits);
/** 工作机器ID(0~31) */
private long workerId;
/** 数据中心ID(0~31) */
private long datacenterId;
/** 毫秒内序列(0~4095) */
private long sequence = 0L;
/** 上次生成ID的时间截 */
private long lastTimestamp = -1L;
//==============================Constructors====================
/**
* 构造函数
* @param workerId 工作ID (0~31)
* @param datacenterId 数据中心ID (0~31)
*/
public SnowflakeIdWorker(long workerId, long datacenterId) {
if (workerId > maxWorkerId || workerId < 0) {
throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0", maxWorkerId));
}
if (datacenterId > maxDatacenterId || datacenterId < 0) {
throw new IllegalArgumentException(String.format("datacenter Id can't be greater than %d or less than 0", maxDatacenterId));
}
this.workerId = workerId;
this.datacenterId = datacenterId;
}
// ==============================Methods=================================
/**
* 获得下一个ID (该方法是线程安全的)
* @return SnowflakeId
*/
public synchronized long nextId() {
long timestamp = timeGen();
//如果当前时间小于上一次ID生成的时间戳,说明系统时钟回退过这个时候应当抛出异常
if (timestamp < lastTimestamp) {
throw new RuntimeException(
String.format("Clock moved backwards. Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
}
//如果是同一时间生成的,则进行毫秒内序列
if (lastTimestamp == timestamp) {
sequence = (sequence + 1) & sequenceMask;
//毫秒内序列溢出
if (sequence == 0) {
//阻塞到下一个毫秒,获得新的时间戳
timestamp = tilNextMillis(lastTimestamp);
}
}
//时间戳改变,毫秒内序列重置
else {
sequence = 0L;
}
//上次生成ID的时间截
lastTimestamp = timestamp;
//移位并通过或运算拼到一起组成64位的ID
return ((timestamp - twepoch) << timestampLeftShift) //
| (datacenterId << datacenterIdShift) //
| (workerId << workerIdShift) //
| sequence;
}
/**
* 阻塞到下一个毫秒,直到获得新的时间戳
* @param lastTimestamp 上次生成ID的时间截
* @return 当前时间戳
*/
protected long tilNextMillis(long lastTimestamp) {
long timestamp = timeGen();
while (timestamp <= lastTimestamp) {
timestamp = timeGen();
}
return timestamp;
}
/**
* 返回以毫秒为单位的当前时间
* @return 当前时间(毫秒)
*/
protected long timeGen() {
return System.currentTimeMillis();
}
//==============================Test=============================================
/** 测试 */
public static void main(String[] args) {
SnowflakeIdWorker idWorker = new SnowflakeIdWorker(0, 0);
for (int i = 0; i < 1000; i++) {
long id = idWorker.nextId();
System.out.println(Long.toBinaryString(id));
System.out.println(id);
}