druid 第一次查询慢_Druid的技术文章

最新推荐文章于 2024-07-24 11:34:22 发布

小鸡小猪

最新推荐文章于 2024-07-24 11:34:22 发布

阅读量980

点赞数

文章标签： druid 第一次查询慢

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42514709/article/details/112109871

版权

本文详细介绍了Druid作为一个高性能实时分析数据库的核心特性，包括列式存储、分布式架构、实时查询与自动聚合。Druid适合实时OLAP场景，其元数据存储在MySQL和Zookeeper中，数据按时间粒度划分并存储在Deep Storage和Historical节点。数据摄入支持实时和批量，提供灵活的数据查询和高效索引。Druid不支持平均值计算，但可通过postAggregations实现。

摘要由CSDN通过智能技术生成

Druid

是一个高性能的实时分析型数据库

核心设计结合了数据仓库，时间序列数据库和搜索系统的思想

OLAP 和 OLTP

OLAP 的全称是 On-Line Analytical Processing

OLTP 的全称是 On-Line Transaction Processing

OLTP 对应常见的关系型数据库

· MySQL

· 实时 OLAP 和离线 OLAP

· Hive + Hadoop，SparkSQL + HDFS，Kylin 等就是离线 OLAP

· 监控告警系统这种对实时性要求比较高的系统就是实时 OLAP

· Druid 就属于实时 OLAP

Druid 的核心特性

· 列式存储。列式存储的优势在于查询的时候可以只返回指定的列的数据，其次同一列数据往往具有很多共性，这带来另一个好处就是存储的时候压缩效果比较好。

· 可扩展的分布式架构

· 并行计算

· 数据摄入支持实时和批量。这里的实时的意思是输入摄入即可查

· 运维友好

· 云原生架构，高容错性

· 支持索引，便于快速查询。

· 基于时间的分区

· 自动聚合

OLAP 系统的共同特性

· 实时摄取可查询。换句话说就是数据查询无延迟，这个在一些对实时性要求比较高的场景下，比如监控告警，还是很重要的。

· 自动实时聚合。

· 高效的索引结构便于查询。

开源技术的补充

Druid 的架构

6 个不同的组件

· 流程图说明

· 实时查询：

· MiddleManager

· 这里 MiddleManager 主要负责查询正在进行摄入的数据查询，MiddleManager 再将请求分发到具体的 peon，也就是 task 的运行实体上

· 离线查询

· Historical

· 历史数据的查询是通过 Historical 查询的，然后数据返回到 Broker 进行汇总。这里需要注意的时候数据查询并不会落到 Deep Storage 上去，也就是查询的数据一定是 cache 到本地磁盘的

· Queries: Routers 将请求路由到 Broker，Broker 向 MiddleManager 和 Historical 进行数据查询

· Data/Segment:得两个功能说明---实时到离线得过程

· MiddleMan

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。