1、 什么是TwitterSnowflake?
简介:
TwitterSnowflake算法是用来在分布式场景下生成唯一ID的。
举个栗子:我们有10台分布式MySql服务器,我们的系统每秒能生成10W条数据插入到这10台机器里,现在我们需要为每一条数据生成一个全局唯一的ID, 并且这些 ID 有大致的顺序。
我们看一下图解:
1位,不用。二进制中最高位为1的都是负数,但是我们生成的id一般都使用整数,所以这个最高位固定是0
41位,用来记录时间戳(毫秒),41位可以表示241−1个数字,如果只用来表示正整数(计算机中正数包含0),可以表示的数值范围是:0 至 241−1,减1是因为可表示的数值范围是从0开始算的,而不是1。也就是说41位可以表示241−1个毫秒的值,转化成单位年则是(241−1)/(1000∗60∗60∗24∗365)=69年
10位,用来记录工作机器id。可以部署在210=1024个节点,包括5位datacenterId和5位workerId
5位(bit)可以表示的最大正整数是25−1=31,即可以用0、1、2、3、…31这32个数字,来表示不同的datecenterId或workerId
12位,序列号,用来记录同毫秒内产生的不同id,12位(bit)可以表示的最大正整数是212−1=4095,即可以用0、1、2、3、…4094这4095个数字,来表示同一机器同一时间截(毫秒)内产生的4095个ID序号
由于在Java中64bit的整数是long类型,所以在Java中SnowFlake算法生成的id就是long来存储的。
SnowFlake可以保证:
所有生成的id按时间趋势递增
整个分布式系统内不会产生重复id(因为有datacenterId和workerId来做区分)
我们来看源码
package onegis.common.utils;
import com.vividsolutions.jts.shape.fractal.KochSnowflakeBuilder;
import java.lang.management.ManagementFactory;
import java.net.InetAddress;
import java.net.NetworkInterface;
/**
* <p>
* 名称:IdWorker.java
* </p>
* <p>
* 描述:分布式自增长ID
* </p>
*
* <pre>
* Twitter的 Snowflake JAVA实现方案
* </pre>
*
* 核心代码为其IdWorker这个类实现,其原理结构如下,我分别用一个0表示一位,用—分割开部分的作用: 1||0---0000000000
* 0000000000 0000000000 0000000000 0 --- 00000 ---00000 ---000000000000
* 在上面的字符串中,第一位为未使用(实际上也可作为long的符号位),接下来的41位为毫秒级时间,
* 然后5位datacenter标识位,5位机器ID(并不算标识符,实际是为线程标识),
* 然后12位该毫秒内的当前毫秒内的计数,加起来刚好64位,为一个Long型。
* 这样的好处是,整体上按照时间自增排序,并且整个分布式系统内不会产生ID碰撞(由datacenter和机器ID作区分),
* 并且效率较高,经测试,snowflake每秒能够产生26万ID左右,完全满足需要。
* <p>
* 64位ID (42(毫秒)+5(机器ID)+5(业务编码)+12(重复累加))
*
* @author Polim
*/
public class IdMakerUtils {
/**
* 时间起始标记点,作为基准,一般取系统的最近时间(一旦确定不能变动)
*/
private final static long TWEPOCH = 1288834974657L;
/**
* 机器标识位数
*/
private final static long WORKER_ID_BITS = 5L;
/**
* 数据中心标识位数
*/
private final static long DATACENTER_ID_BITS = 5L;
/**
* 机器ID最大值
*/
private final static long MAX_WORKER_ID = -1L ^ (-1L << WORKER_ID_BITS);
/**
* 数据中心ID最大值
*/
private final static long MAX_DATACENTER_ID = -1L ^ (-1L << DATACENTER_ID_BITS);
/**
* 毫秒内自增位
*/
private final static long SEQUENCE_BITS = 12L;
/**
* 机器ID偏左移12位
*/
private final static long WORKER_ID_SHIFT = SEQUENCE_BITS;
/**
* 数据中心ID左移17位
*/
private final static long DATACENTER_ID_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS;
/**
* 时间毫秒左移22位
*/
private final static long TIMESTAMP_LEFT_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS + DATACENTER_ID_BITS;
/**
*
*/
private final static long SEQUENCE_MASK = -1L ^ (-1L << SEQUENCE_BITS);
/**
* 上次生产id时间戳
*/
private static long lastTimestamp = -1L;
/**
* 0,并发控制
*/
private long sequence = 0L;
private final long workerId;
/**
* 数据标识id部分
*/
private final long datacenterId;
public IdMakerUtils() {
this.datacenterId = getDatacenterId(MAX_DATACENTER_ID);
this.workerId = getMaxWorkerId(datacenterId, MAX_WORKER_ID);
}
/**
* @param workerId
* 工作机器ID(0~31)
* @param datacenterId
* 序列号(0~31)
*/
public IdMakerUtils(long workerId, long datacenterId) {
if (workerId > MAX_WORKER_ID || workerId < 0) {
throw new IllegalArgumentException(
String.format("worker Id can't be greater than %d or less than 0", MAX_WORKER_ID));
}
if (datacenterId > MAX_DATACENTER_ID || datacenterId < 0) {
throw new IllegalArgumentException(
String.format("datacenter Id can't be greater than %d or less than 0", MAX_DATACENTER_ID));
}
this.workerId = workerId;
this.datacenterId = datacenterId;
}
/**
* 获取下一个ID(该方法线程安全)
*
* @return
*/
public synchronized long nextId() {
long timestamp = timeGen();
//如果当前时间小于上一次ID生成的时间戳,说明系统时钟会退回这个时候应当抛出的异常
if (timestamp < lastTimestamp) {
throw new RuntimeException(String.format(
"Clock moved backwards. Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
}
//如果同一时间生成的,则进行毫秒内序列
if (lastTimestamp == timestamp) {
// 当前毫秒内,则+1
sequence = (sequence + 1) & SEQUENCE_MASK;
//毫秒内序列溢出
if (sequence == 0) {
// 当前毫秒内计数满了,则等待下一秒
timestamp = tilNextMillis(lastTimestamp);
}
//时间戳改变,毫秒内序列重置
} else {
sequence = 0L;
}
//上次生成ID的时间戳
lastTimestamp = timestamp;
// ID偏移组合生成最终的ID,并返回ID
long nextId = ((timestamp - TWEPOCH) << TIMESTAMP_LEFT_SHIFT) | (datacenterId << DATACENTER_ID_SHIFT)
| (workerId << WORKER_ID_SHIFT) | sequence;
String id = String.valueOf(nextId);
id = id.substring(6, id.length());
nextId = Long.parseLong(id);
return nextId;
}
/**
* @descript: 阻塞到下一个毫秒,直到获得新的时间戳
* @param:lastTimestamp 上次生成ID的时间截
* @return: 当前时间戳
**/
private long tilNextMillis(final long lastTimestamp) {
long timestamp = this.timeGen();
while (timestamp <= lastTimestamp) {
timestamp = this.timeGen();
}
return timestamp;
}
/**
* @descript: 返回以毫秒为单位的当前时间
* @param:
* @return: 当前时间(毫秒)
**/
private long timeGen() {
return System.currentTimeMillis();
}
/**
* <p>
* 获取 MAX_WORKER_ID
* </p>
*/
protected static long getMaxWorkerId(long datacenterId, long maxWorkerId) {
StringBuffer mpid = new StringBuffer();
mpid.append(datacenterId);
String name = ManagementFactory.getRuntimeMXBean().getName();
if (!name.isEmpty()) {
/*
* GET jvmPid
*/
mpid.append(name.split("@")[0]);
}
/*
* MAC + PID 的 hashcode 获取16个低位
*/
return (mpid.toString().hashCode() & 0xffff) % (maxWorkerId + 1);
}
/**
* <p>
* 数据标识id部分
* </p>
*/
protected static long getDatacenterId(long maxDatacenterId) {
long id = 0L;
try {
InetAddress ip = InetAddress.getLocalHost();
NetworkInterface network = NetworkInterface.getByInetAddress(ip);
if (network == null) {
id = 1L;
} else {
byte[] mac = network.getHardwareAddress();
id = ((0x000000FF & (long) mac[mac.length - 1])
| (0x0000FF00 & (((long) mac[mac.length - 2]) << 8))) >> 6;
id = id % (maxDatacenterId + 1);
}
} catch (Exception e) {
System.out.println(" getDatacenterId: " + e.getMessage());
}
return id;
}
//测试
public static void main1(String[] args) {
IdMakerUtils makerUtils = new IdMakerUtils();
System.out.println(makerUtils.nextId());
}
public static void main(String[] args) {
IdMakerUtils makerUtils = new IdMakerUtils(0,0);
for (int i = 0;i<10;i++){
long id = makerUtils.nextId();
System.out.println(Long.toBinaryString(id));
System.out.println(id);
}
}
}