大数据最新StarRocks实战——欢聚集团极速的数据分析能力_starrocks quota，一个大数据开发程序员的面试心得

最新推荐文章于 2024-07-31 14:52:36 发布

2401_84181309

最新推荐文章于 2024-07-31 14:52:36 发布

阅读量982

点赞数 20

分类专栏：程序员文章标签：大数据面试学习

本文链接：https://blog.csdn.net/2401_84181309/article/details/138733500

版权

程序员专栏收录该内容

167 篇文章 1 订阅

订阅专栏

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化资料的朋友，可以戳这里获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

欢聚集团面向的是各个国家的用户市场，数据分析场景就要因地制宜。体现到大数据平台这一层，数据来源多样化，数据分析场景复杂，数据模型复用率低。在这样的业务现状下，原有的 OLAP 引擎已无法满足欢聚集团的整体数据分析需求，下文主要介绍如何基于StarRocks 构建灵活、极速、统一的全新 OLAP 分析平台。

一、大数据平台架构

数据平台支撑了从数据埋点上报到数据应用的全链路数据服务，提供了埋点管理平台、离线计算调度系统、实时计算平台、数据应用系统等众多数据产品，实现闭环的一站式大数据平台服务。

总体架构分层上，可以分为数据集成、存储、计算、分析、应用。OLAP系统是分析层的核心引擎，支撑Ad-Hoc自助分析、多维分析数据服务、BI报表、标签画像等分析场景。

二、OLAP选型及改进

此前，我们使用 ClickHouse 作为 OLAP 引擎，但随着业务对灵活性要求越来越高， ClickHouse 遇到了难以逾越的瓶颈。因此，我们重新梳理了需求，试图寻找一款更加适合欢聚集团的 OLAP 引擎。针对出海业务的特殊性，大数据团队需要提供非常灵活多变、轻量、高效、包容的数据分析服务：

灵活多变: 相比数据量和性能，灵活性更重要
轻量: 架构要简单，最好能一个引擎搞定所有场景
高效: 使用门槛要低，各种业务都能快速接入使用
包容: 能良好地兼容大数据生态

具体的诉求是：

支持ROLAP、MOLAP分析场景
数据模型支持宽表、星型模型、雪花模型等
同时兼顾数据量（PB）、查询性能（秒级）、灵活性（导数与查询灵活多变）
数据时效性上支持离线批处理、实时流处理秒级可见
数据写入支持Append、Overwrite、Upsert、Delete
高可用、灵活扩缩容、低运维成本
较高的QPS（高并发）
支持分析Hadoop上的数据

在这种“既要又要还要”的诉求下，选型很困难。OLAP 常用的技术架构有预计算、MPP、索引。我们调研了这三类架构的典型 OLAP 引擎：

**预计算架构：**代表引擎 Apache Kylin/Apache Druid ，查询性能优越，但缺少灵活性。
MPP 架构：Presto/Apache Impala/SparkSQL，灵活性很好，但性能较差，一般在分钟级。
索引架构：ES/ClickHouse，单表查询性能优越，但是 Join 几乎不可用，只能用宽表模型。

单一技术架构的引擎很难满足需求，因此我们把目标瞄向混合架构引擎：同时具有预计算、MPP 计算、支持索引的引擎。目前市面上这类引擎不多，比较成熟的有 Apache Doris 和 StarRocks。最后选择 StarRocks，原因是 StarRocks 的社区更加活跃，产品的背后还有一支大胆创新的强大技术团队，响应非常及时，我们对 StarRocks 的未来更有信心。

如上图所示，我们的 OLAP 系统架构非常简单轻量，与大数据平台上下游都做了整合。

StarRocks原生提供丰富的数据导入方式，Http模式的 Stream load、读 HDFS的Broker load、读消息中间件的 Routing load、Flink Connector、DataX、外表支持等，方便和大数据生态完成数据集成。StarRocks查询支持最为通用的MySQL JDBC 协议，集成到各种BI，数据应用系统几乎无成本。

目前我们内部整合了 OLAP 系统，下线了 ClickHouse，统一使用 StarRocks 作为解决方案，已经在实时查询、报表分析、监控等业务场景中大力推广，支撑了数百 TB 数据，数十个业务方，数百万查询量/天，总体查询性能 99 分位 200ms。

三、StarRocks 经验沉淀

3.1 资源隔离，助力业务推广

3.1.1 面临的挑战

我们的 StarRocks 集群目前都是多业务共用，其中部分业务场景是大查询。例如 BI 报表一个Dashboard（数据看板）包含多个图表，打开 Dashboard时，所有图表一起加载，并且一般都是偏分析的SQL，资源开销较大。此时集群资源就有一个高峰，集群查询性能衰减，特别是小查询也会受到严重影响。下图中可以看到很多毛刺，都是大查询导致。