Apache Druid架构原理与应用场景

Druid是一个分布式时序数据库,适用于交互式聚合查询和实时分析。它由Realtime Node、Historical Node、Broker Node和Coordinator Node组成,依赖于元数据库、分布式协调服务和数据文件存储。数据摄入过程中,Realtime Node生成Segment并上传,Historical Node加载Segment。关键配置如segmentGranularity、queryGranularity、intermediatePersistPeriod和windowPeriod影响数据处理和查询效率。
摘要由CSDN通过智能技术生成

Druid本质是一个分布式时序数据库,其设计恰好满足这个场景:

  1. Historical数据存储使用HDFS等成熟的分布式文件系统方案,高可用、水平扩容

  2. Lambda架构,Realtime部分使用LSM-Tree实现,满足流数据的即时查询需求

下面从2方面,整理一下Druid的关键技术点:

  1. Druid架构设计

  2. 数据摄入

  3. 几个重要配置

当业务中出现以下情况时,Druid 是一个很好的技术方案选择:

  • 需要交互式聚合和快速探究大量数据时;

  • 需要实时查询分析时;

  • 具有大量数据时,如每天数亿事件的新增、每天数 10T 数据的增加;

  • 对数据尤其是大数据进行实时分析时;

  • 需要一个高可用、高容错、高性能数据库时。

一、Druid架构设计

Druid自身包含下面4类节点:

  • Realtime Node:即时摄入实时数据,生成Segment(LSM-Tree实现与Hbase基本一致,不再赘述)文件。

  • Historical Node:加载已生成好的数据文件,以供数据查询。

  • Broker Node:对外提供数据查询服务,并同时从Realtime Node和Historical Node查询数据&

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值