3.1 设置数据中心id与工作机器id
获取工作机器ID和数据中心ID需要根据实际情况来进行调整。一般来说,可以通过以下几种方式来获取这些参数:
3.1.1 手动指定
在开发过程中,你可以手动为每台机器分配一个唯一的工作机器ID和数据中心ID,例如:
private static final long DATA_CENTER_ID = 1L; // 数据中心ID
private static final long WORKER_ID = 1L; // 工作机器ID
这里我们将数据中心ID设置为1,工作机器ID也设置为1。当然,在实际应用中,需要根据机器数量和实际情况来调整这些参数,以保证生成的ID足够唯一且不会重复。
可以写1作为工作机器ID或数据中心ID,但是这样可能会导致生成的ID不够唯一,特别是在分布式系统中。为了保证生成的ID足够唯一且不会重复,建议将工作机器ID和数据中心ID设置为较大的值,例如16、32、64等。
Snowflake算法中规定,数据中心ID和工作机器ID的取值范围都是0~31,因此最多支持32个数据中心,每个数据中心最多支持32个工作机器。如果你的分布式系统中机器数量超过了这个限制,就需要使用更大的取值范围来确保生成的ID足够唯一。
3.1.2使用配置文件
在部署应用程序时,你可以使用配置文件来指定工作机器ID和数据中心ID。例如,在Spring Boot应用程序中,可以通过配置文件来指定这些参数:
snowflake.data-center-id=1
snowflake.worker-id=1
然后在代码中读取这些配置,创建SnowflakeIdGenerator实例时将其传入即可。例如:
@Component
public class SnowflakeIdGenerator {
private final com.fasterxml.uuid.impl.TimeBasedGenerator generator;
public SnowflakeIdGenerator(@Value(“
s
n
o
w
f
l
a
k
e
.
d
a
t
a
−
c
e
n
t
e
r
−
i
d
"
)
l
o
n
g
d
a
t
a
C
e
n
t
e
r
I
d
,
@
V
a
l
u
e
(
"
{snowflake.data-center-id}") long dataCenterId, @Value("
snowflake.data−center−id")longdataCenterId,@Value("{snowflake.worker-id}”) long workerId) {
this.generator = Generators.timeBasedGenerator(com.fasterxml.uuid.impl.RandomUtil.getSecureRandom(), dataCenterId, workerId);
}
public synchronized String nextId() {
return generator.generate().toString();
}
}
在这个示例中,我们通过构造函数来接收工作机器ID和数据中心ID,并使用它们来创建SnowflakeIdGenerator实例。同时,我们也可以在代码中对这些参数进行校验,以确保它们的合法性。
3.1.3使用自动化工具
除了手动分配和配置文件之外,你还可以使用一些自动化工具来为每台机器分配唯一的工作机器ID和数据中心ID。例如,可以使用ZooKeeper等分布式协调服务来为每台机器分配一个唯一的ID。
在实际应用中,可以使用ZooKeeper等分布式协调服务来为每台机器分配唯一的工作机器ID和数据中心ID。
具体实现方式如下:
在ZooKeeper集群中创建一个持久化的节点,例如/snowflake。
每个机器启动时,向该节点下创建一个临时有序节点,例如/snowflake/worker-。
每个机器获取自己创建的节点名,并解析出其中的序号。例如,如果节点名为/snowflake/worker-0000000010,则其序号为10。
将序号作为工作机器ID,同时将ZooKeeper的客户端ID(即会话ID)的低32位作为数据中心ID。
这样就可以保证每个机器的工作机器ID和数据中心ID都是唯一的,不会重复。同时,由于节点创建时是临时有序节点,因此当机器宕机或者断开连接时,其节点会被自动删除,不会对其他机器造成影响。
需要注意的是,使用ZooKeeper等分布式协调服务需要对ZooKeeper的配置和使用有一定的了解,同时也需要考虑网络延迟等因素对性能的影响。如果对ZooKeeper不熟悉或者想要更简单的解决方案,也可以使用第三方的分布式ID生成器库,例如Twitter的Snowflake-java或者百度的UidGenerator等。
3.2 使用三方库生成
3.2.1需要引入依赖才能使用第三方的分布式ID生成器库:
3.2.1.1 Snowflake-java库(已不再维护)
对于Snowflake-java库,需要在pom.xml文件中添加以下依赖:
com.github.twitter snowflake 0.0.1-SNAPSHOTlong datacenterId = new SnowflakeIdWorker(0, 0).getDatacenterId();
long workerId = new SnowflakeIdWorker(0, 0).getWorkerId();
/*创建了两个SnowflakeIdWorker对象,并从中获取数据中心ID和工作机器ID。
在实际使用时,可以根据需要调整构造函数中的参数,以确保生成的ID足够唯一且不会重复*/
需要注意的是,该库目前已经不再维护,因此建议使用其他类似的库,例如美团的Leaf算法或者百度的UidGenerator等。
3.2.1.2 百度UidGenerator库
对于UidGenerator库,需要在pom.xml文件中添加以下依赖:
org.n3r uid-generator 2.3.4long datacenterId = UidGenerator.DEFAULT_DATA_CENTER_ID;
long workerId = UidGenerator.getWorkerId();
/*这里我们直接使用了默认的数据中心ID,并通过getWorkerId()方法获取了工作机器ID。
在实际使用时,也可以根据需要调整这些参数,以确保生成的ID足够唯一且不会重复*/
需要注意的是,在使用第三方的分布式ID生成器库时,也需要根据实际情况来进行调整,并确保生成的ID足够唯一且不会重复。同时,这些库的实现机制和Snowflake算法可能有所不同,需要仔细研究其文档和源代码,以确保生成的ID符合我们的要求。
3.2.1.3 美团Leaf
在pom.xml文件中添加以下依赖:
io.github.leaf-oss自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数大数据工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年大数据全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上大数据开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以添加VX:vip204888 (备注大数据获取)
95%以上大数据开发知识点,真正体系化!**
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以添加VX:vip204888 (备注大数据获取)
[外链图片转存中…(img-nAXAkIii-1712591907430)]