SkyWalking 基于 ShardingSphere-Proxy 的 MySQL-Sharding 分库分表的存储特性介绍

9f87d0f814fd59722bb915c309ca99b9.png

Apache SkyWalking 作为一个分布式系统的应用性能监控工具,它观察服务网格中的指标、日志、痕迹和事件。其中 SkyWalking OAP 高性能的数据流处理架构能够实时处理庞大的数据流量,但是这些海量数据的存储更新和后续查询对后端存储系统带来了挑战。

SkyWalking 默认已经提供了多种存储支持包括 H2、OpenSearch、ElasticSearch、MySQL、TiDB、PostgreSQL、BanyanDB。其中 MySQL 存储提供的是针对单机和单表的存储方式(MySQL 的集群能力需要自己选型提供),在面对高流量的业务系统时,监控数据的存储存在较大压力,同时影响查询性能。

4a2ce9edb4999dcac63f87a4e3ec3160.png

在 MySQL 存储基础上 SkyWalking v9.3.0 提供了一种新的存储方式 MySQL-Sharding:它提供了基于 ShardingSphere-Proxy[1] 的分库分表特性,而分库分表是关系型数据库面对大数据量处理的成熟解决方案。

部署架构

SkyWalking 使用 ShardingSphere-Proxy 的部署方式如下图所示。

df7a7b7fba2035b5500ea63a35199367.jpeg

部署架构

  • • SkyWalking OAP 由直连数据库的方式变成只与 ShardingSphere-Proxy[2] 进行交互;

  • • 每一个 MySQL 节点暴露的连接都是一个数据源,由 ShardingSphere-Proxy[3] 进行统一管理;

  • • ShardingSphere-Proxy[4] 会根据配置建立一个虚拟逻辑数据库,根据 OAP 提供的分库分表规则进行库表分片和路由;

  • • SkyWalking OAP 负责生成分库分表规则并且像操作 MySQL 一样对虚拟逻辑库执行 DDL 和 DML;

适用场景

希望使用 MySQL 作为存储,随着业务规模的增长,单表模式已经无法满足性能需要。

SkyWalking 分库分表逻辑

分库分表逻辑通过注解

 @SQLDatabase.Sharding 对 SkyWalking 中的数据模型 Model 进行定义:

@interface Sharding {
  ShardingAlgorithm shardingAlgorithm();
  String dataSourceShardingColumn() default "";
  String tableShardingColumn() default "";
}

其中:

  • • shardingAlgorithm:表分片算法

  • • dataSourceShardingColumn:分库键

  • • tableShardingColumn:分表键

SkyWalking 根据注解 @SQLDatabase.Sharding 选择分库键、分表键以及表分片算法对每个表动态生成分片规则通过 DistSQL 操作 Shardingsphere-Proxy[5] 执行规则定义 Shardingsphere-Proxy[6] 根据规则定义进行数据分片。

分库方式

SkyWalking 对于分库采用统一的方式,路由目标库的数字后缀使用分库键的哈希值取模需要分库的数据库数量,所以路由目标库为:

ds_{dataSourceShardingColumn.hashcode() % dataSourceList.size()}

例如我们有 dataSourceList = ds_0...ds_n,如果

{dataSourceShardingColumn.hashcode() % dataSourceList.size() = 2} 那么所有数据将会路由到 ds_2 这个数据源节点上。

分表方式

由于 TTL 机制的存在,分表算法主要根据时间的日期进行分片,分片表的数量是根据 TTL 每天一个表:

分片表名 = 逻辑表名_时间序列(日期):{tableName =logicTableName_timeSeries}

为保证在 TTL 有效期内的数据能够被写入和查询,时间序列将生成当前日期

{timeSeries = currentDate - TTL +1...currentDate + 1}

例如:如果 TTL=3, currentDate = 20220907,则分片表为:

logicTableName_20220905
logicTableName_20220906
logicTableName_20220907
logicTableName_20220908

SkyWalking 提供了多种不同的分表算法用于不同的数据模型:

ac57ab4c451f02c233440a1114c02ec0.png

表格详细内容可跳转原文链接,进行浏览

TTL 机制

  • • 对于进行分片的表根据 TTL 直接删除

  •  deadline >= timeSeries 的物理表

  •  {deadline = new DateTime().plusDays(-ttl)}

  • • TTL 定时器在根据当前日期删除过期表的同时也会根据新日期更新分片规则,通知 ShardingSphere-Proxy 创建新的分片表

  • • 对于单表的延续之前的方式,删除 deadline >= time_bucket 的行记录

分片数据存储示例

下面以 segment(Record 类型)和 service_resp_time(Metrics 类型)两个为例说明数据存储的逻辑和物理分布。这里假设 MySQL 为 ds_0 和 ds_1 两个节点。

注意:以下的存储表结构仅为简化后的存储示例,不表示 SkyWalking 真实的表结构。

d2addb1deea61046efaa742f9a23b7bf.gif

segment

分片配置为:

@SQLDatabase.Sharding(shardingAlgorithm = ShardingAlgorithm.TIME_SEC_RANGE_SHARDING_ALGORITHM, dataSourceShardingColumn = service_id, tableShardingColumn = time_bucket)

逻辑库表结构和实际库表如下图:

9730cf256c61ab03a8d47c403bab4db5.jpeg

逻辑表结构和实际库表 1

a7ed23eae486b83d8ca5f2fa95424a90.gif

service_resp_time

分片配置为:

@SQLDatabase.Sharding(shardingAlgorithm = ShardingAlgorithm.TIME_RELATIVE_ID_SHARDING_ALGORITHM, tableShardingColumn = id, dataSourceShardingColumn = entity_id)

逻辑库表结构和实际库表如下图:

e6cfde9b6698fe7a64641f0ea3f4d621.jpeg

逻辑表结构和实际库表 2

如何使用

你可以选择手动或使用 Docker 来运行 Demo。

ff43797666c225f19d4aa2dab47f30df.gif

手动部署

这里以单节点 SkyWalking OAP 和 Shardingsphere-Proxy 5.1.2[7] 部署为例,集群部署请参考其他相关文档。

  • • 准备好 MySQL 集群

  • • 部署安装并配置 Shardingsphere-Proxy[8]

    • • conf/server.yamlprops.proxy-hint-enabled 必须为 true,完整配置可参考这里 [9]

    • • conf/config-sharding.yaml,配置逻辑数据库和 dataSources 列表,dataSource 的名称必须以 ds_为前缀,并且从 ds_0 开始,完整配置可参考这里 [10]

  • • 部署安装并配置 SkyWalking OAP:注意:连接信息需对应 Shardingsphere-Proxy[11] 虚拟数据库。

    • • 设置 OAP 环境变量 ${SW_STORAGE:mysql-sharding}

    • • 根据实际部署情况配置连接信息: ${SW_JDBC_URL} ${SW_DATA_SOURCE_USER} ${SW_DATA_SOURCE_PASSWORD}

  • • 将 Shardingsphere-Proxy[12] 中 conf/config-sharding.yaml 配置的数据源名称配置在 ${SW_JDBC_SHARDING_DATA_SOURCES} 中,用 , 分割

  • • 启动 MySQL 集群

  • • 启动 Shardingsphere-Proxy[13]

  • • 启动 SkyWalking OAP

0e6fd286aae18cfd27d26178f2a8ee77.gif

使用 Docker 

运行 Demo

GitHub 资源库提供了一个基于 Docker 完整可运行的 demo:skywalking-mysql-sharding-demo[14],可以快速尝试实际运行效果。

其中部署包含:

  • • oap 服务 1 个,Metrics 和 Record 数据的 TTL 均设为 2 天

  • • sharding-proxy 服务 1 个版本为 5.1.2,对外端口为 13307,创建的逻辑库名称为 swtest

  • • mysql 服务 2 个,对外端口分别为 3306,3307,在 sharding-proxy 的 conf/config-sharding.yaml 中配置为 ds_0 和 ds_1

  • • provider 服务 1 个(模拟业务程序用于验证 trace 和 metrics 等数据),对外端口为 9090

  • • consumer 服务 1 个(模拟业务程序用于验证 trace 和 metrics 等数据),对外端口为 9092

将 Demo 程序获取到本地后,在 skywalking-mysql-sharding-demo 目录下直接运行:

docker-compose up -d

注意:初次启动由于拉取镜像和新建所有表可能需要一定的时间。

所有服务启动完成之后可以通过数据库工具查看 sharding-proxy 逻辑表创建情况,以及两个 MySQL 库中实际的物理分片表创建情况。也可以连接 sharding-proxy 逻辑库 swtest 查看数据查询路由情况,如:

PREVIEW
SELECT * FROM SEGMENT

显示结果如下:

c1f09b33c7e59f1f4f0fb4a2f03a31e0.jpeg

查询结果

Demo 提供的模拟业务程序可以通过请求 consumer 服务模拟业务请求,用于验证各类型数据分布:

curl http://127.0.0.1:9092/info


结语
在这篇文章中我们详细介绍了 SkyWalking 基于 ShardingSphere-Proxy 的 MySQL-Sharding 存储特性的部署架构、适应场景、核心分库分表逻辑以及 TTL 机制,并提供了运行后的数据存储示例和详细部署配置步骤以便大家快速理解上手。SkyWalking 提供了多种存储方式以供选择,如果你目前的需求如本文所述,欢迎使用该新特性。
引用链接[1] ShardingSphere-Proxy: https://shardingsphere.apache.org/document/5.1.2/cn/quick-start/shardingsphere-proxy-quick-start/
[2] ShardingSphere-Proxy: https://shardingsphere.apache.org/document/current/en/overview/#shardingsphere-proxy
[3] ShardingSphere-Proxy: https://shardingsphere.apache.org/document/current/en/overview/#shardingsphere-proxy
[4] ShardingSphere-Proxy: https://shardingsphere.apache.org/document/current/en/overview/#shardingsphere-proxy
[5] Shardingsphere-Proxy: https://shardingsphere.apache.org/document/current/en/overview/#shardingsphere-proxy
[6] Shardingsphere-Proxy: https://shardingsphere.apache.org/document/current/en/overview/#shardingsphere-proxy
[7] Shardingsphere-Proxy 5.1.2: https://shardingsphere.apache.org/document/current/en/overview/#shardingsphere-proxy
[8] Shardingsphere-Proxy: https://shardingsphere.apache.org/document/current/en/overview/#shardingsphere-proxy
[9] https://github.com/wankai123/skywalking-mysql-sharding-demo/blob/main/shardingsphere-proxy/conf/server.yaml
[10] https://github.com/wankai123/skywalking-mysql-sharding-demo/blob/main/shardingsphere-proxy/conf/config-sharding.yaml
[11] Shardingsphere-Proxy: https://shardingsphere.apache.org/document/current/en/overview/#shardingsphere-proxy
[12] Shardingsphere-Proxy: https://shardingsphere.apache.org/document/current/en/overview/#shardingsphere-proxy
[13] Shardingsphere-Proxy: https://shardingsphere.apache.org/document/current/en/overview/#shardingsphere-proxy
[14] skywalking-mysql-sharding-demo: https://github.com/wankai123/skywalking-mysql-sharding-demo
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值