近日,YMatrix 5.0 正式发布,通过 138 项优化,实现了性能的全方位突破。其中针对单表查询分析性能,我们进行了 SSB 基准测试,对标大宽表性能标杆 ClickHouse。结果显示:YMatrix 在两种测试数据规模下,分别比 CK 提升了 24% 及 37%。
详细的测试报告如下:
01 测试结论
Star Schema Benchmark(以下简称 SSB)是目前业界普遍采用的一个星型测试集(注1),它是从 TPC-H (注2)演化出来的一种针对分析场景的“性价比”评价标准。在 SSB 基准测试中定义了 13 个查询场景,从不同角度和维度,考察了一个分析型数据库的综合性能。
随着社区发展,SSB 最初的设计并不完全适用于今天大部分数仓的使用模式。Apache Druid 在最近的一次基准测试中(注3),基于原始版本提出了一种 SSB 变体,即:将多张原始表数据先做一次聚合转化为一张宽表,然后基于这张宽表来执行 SSB 基准测试中的各测试项。在 ClickHouse 发布的最新 SSB 基准测试结果中,同样采用了这种方案。(注4)
此次 YMatrix 5.0 采用了与 ClickHouse 一致的 SSB 基准测试模型,分别测试了 100倍和 1000倍数据规模(SSB的数据规模来源于 TPC-H 的 scale factor)。其中 100倍数据的宽表数据量约为 6亿条数据,1000 倍数据的宽表数据量约为 60亿。测试结果中,100 倍数据规模下 ClickHou