《快手万亿级实时OLAP平台的建设与实践》总结

最新推荐文章于 2024-08-07 10:17:43 发布

Mr_小白不白

最新推荐文章于 2024-08-07 10:17:43 发布

阅读量1.9k

点赞数 1

分类专栏： druid 文章标签： druid OLAP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaobai51509660/article/details/88634493

版权

druid 专栏收录该内容

8 篇文章 1 订阅

订阅专栏

最近阅读了《快手万亿级实时OLAP平台的建设与实践》这篇博文，在公司内部也采用了druid作为实时OLAP的查询引擎，快手的在druid中的优化总结如下：

（1）集群规模和效果

（2）druid内部查询技术点

数据的预聚合、列式存储、bitmap索引，查询结果的中间缓存等。

（3）快手使用和查询优化经验

1:资源隔离部署方案.

冷热数据分离，热数据SSD ,冷数据HDD

tier配置，对特殊业务单独配置tier。

2：物化视图

从维度上来讲，对于一个大的datasource，根据查询维度的热度，再独立建立相应的datasource ，典型的空间换时间。

从时间的维度上来讲，大范围的时间查询，分钟级聚合->小时级聚合->天级别聚合。

3：元数据交互加速（百万级别的segments）

overlord与mysql交互优化：添加慢查询的索引，如 dataSource、used、end.

coordinator 与mysql交互优化：

coordinator全量扫描druid_segments表改为增量扫描。添加used、create_date索引。

coordnator扫描segment匹配rule过程串行->并行。

4: indexing service 调度优化

task count 根据kafka lag 自动伸缩。

middle manager 的indexing task 资源分配从slot改成按照内存分配,可以指定task内存大小进行提交。

并行compaction:串行扫描segments compaction ->hadoop任务，并行compaction .

5:集群管理系统

druid数据源管理系统：自助管理druid datasource，和indexing task .

druid 探针系统：数据源冷热查询热度分析，冷/无用数据源的发现，高基维度的发现，无用维度/指标的发现。

6：数据可视化工具superset

此外还有多time shift支持和改进、多chart窗口联动、报警功能设计。

参考文章：

快手万亿级实时 OLAP 平台的建设与实践

Mr_小白不白

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。