Butterfly:超高性能的发号器框架
在分布式系统中,唯一ID的生成是一个常见且关键的需求。Butterfly(蝴蝶)框架以其卓越的性能和创新的设计,为这一需求提供了全新的解决方案。本文将深入介绍Butterfly框架,分析其技术特点,并探讨其应用场景。
项目介绍
Butterfly是一个超高性能的发号器框架,它通过引入多种新的方案,不仅解决了雪花算法存在的所有问题,还提供了比雪花算法更高的性能。在单机版QPS理论值为51.2(w/s)的情况下,Butterfly在一些机器上可达1200(w/s)甚至更高。框架的名称“Butterfly”寓意着其生成的ID如同世界上没有完全相同的蝴蝶翅膀一样,具有唯一性。
项目技术分析
解决雪花算法的问题
雪花算法是Twitter提出的分布式ID生成器方案,但它存在三个主要问题:
- 时间回拨问题:Butterfly采用“历史时间”方案,每次请求只增序列值,序列值增满后,“历史时间”增1,序列值归0。
- 机器ID的分配和回收问题:Butterfly提供两种方案:Zookeeper和DB。Zookeeper通过哈希和扩容机器分配ID,DB通过查找机制分配ID。回收方案中,Zookeeper采用永久节点存储下次过期时间,DB添加过期时间字段。
- 机器ID的上限问题:Butterfly采用改造版雪花+Zookeeper分配ID方案作为服务端节点,客户端采用双Buffer+异步获取提高性能。
新的方案特性
- 全局唯一:确保生成的ID在全局范围内唯一。
- 无时间回拨问题:通过“历史时间”方案彻底解决时间回拨问题。
- 超高性能:纯内存化操作,性能特别高,理论最高可达51.2w/s甚至更高。
- 生成的ID无法反解析时间:提高安全性。
- 非严格的整体自增:适用于对时间不敏感,只要求唯一性的场景。
项目及技术应用场景
Butterfly框架适用于以下场景:
- 超高并发情况:如单机百万千万级别的并发。
- 对时间不敏感,只要求唯一性:适用于需要全局唯一ID的场景。
- 不要求完全自增:适用于对ID顺序要求不严格的场景。
项目特点
- 全局唯一:确保每个生成的ID都是全局唯一的。
- 无时间回拨问题:通过创新的“历史时间”方案,彻底解决了时间回拨问题。
- 超高性能:采用纯内存化操作,性能极高,理论最高可达51.2w/s甚至更高。
- 信息安全:生成的ID不是完全连续的,防止外部恶意的数据爬取。
- 易用性:开发接入非常简单,目前已发布到Maven中央仓库。
快速入门
Butterfly提供了多种机器ID分配方式,包括单机版的Zookeeper和DB分配,以及分布式版的distribute分配。以下是一些快速入门示例:
Zookeeper分配workerId
<dependency>
<groupId>com.github.simonalong</groupId>
<artifactId>butterfly-allocator-zookeeper</artifactId>
<version>${last.version.release}</version>
</dependency>
使用示例
@Test
public void test(){
ZkButterflyConfig config = new ZkButterflyConfig();
config.setHost("localhost:2181");
ButterflyIdGenerator generator = ButterflyIdGenerator.getInstance(config);
generator.setStartTime(2020, 5, 1, 0, 0, 0);
generator.addNamespaces("test1", "test2");
Long uuid = generator.getUUid("test1");
System.out.println(uuid);
}
DB分配workerId
<dependency>
<groupId>com.github.simonalong</groupId>
<artifactId>butterfly-allocator-db</artifactId>
<version>${last.version.release}</version>
</dependency>
使用示例
@Test
public void test(){
DbButterflyConfig config = new DbButterflyConfig();
config.setUrl
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考