Doris——纵腾集团流批一体数仓架构

吵吵叭火

已于 2024-04-15 12:36:42 修改

阅读量2.4k

点赞数 23

分类专栏：大数据 # Doris 文章标签：大数据数据仓库

于 2024-03-02 22:45:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SHWAITME/article/details/136423469

版权

大数据同时被 2 个专栏收录

55 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

26 篇文章

订阅专栏

本文详细描述了纵腾集团如何从早期复杂架构转变为基于Doris的简化数据架构，包括数据中台的构建、数仓建模、性能优化和实践经验，展示了Doris在提升查询效率、数据导入速度和架构稳定性方面的优势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目录

一、早期架构

二、架构选型

三、新数据架构

3.1 数据中台

3.2 数仓建模

3.3 数据导入

四、实践经验

4.1 准备阶段

4.2 验证阶段

4.3 压测阶段

4.4 上线阶段

4.5 宣导阶段

4.6 运行阶段

4.6.1 Tablet规范问题

4.6.2 集群读写优化

五、总结收益

六、未来规划

原文大佬的这篇Doris数仓建设案例有借鉴意义，这里摘抄下来用作学习和知识沉淀。如有侵权请告知~

前言

纵腾集团以“全球跨境电商基础设施服务商”为企业定位，聚焦跨境仓储与物流。随着纵腾集团业务的快速发展，早期基于多套 CDH 大数据架构的技术栈和组件繁杂，开发和运维难度高、效率低，数据质量和时效难以保障，已无法满足当下数据分析需求，严重影响相关工作的开展。因此，纵腾集团在 2022年正式引入Doris，基于Doris 构建了新的流批一体数据架构，同时建立了以 Doris 为核心的数据中台。构建过程中对读写时效性、服务的稳定性及高并发读写等多方面进行了优化。

一、早期架构

早期数仓架构主要分为两套基于 CDH 的大数据集群，这两套架构用于不同产品线的数仓需求、数据大屏和BI报表等应用。

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。