Apache Druid
文章平均质量分 84
JiangHao Lan
邮箱:528601933@qq.com
展开
-
Apache Druid分析型数据库设计-查询处理
查询分布在Druid集群中,由Broker进行管理。查询首先进入Broker,它识别有可能与该查询相关的数据的段。段的列表总是按时间剪枝(prune),也可能根据数据源的分区方式由其他属性剪枝。Broker然后将确定哪些Historical和MiddleManager正在为这些段提供服务,然后将重写的子查询分发给这些进程中的每一个。Historical/MiddleManager进程执行每个子查询并将结果返回给Broker。Broker合并这些部分结果以得到最终答案,并将其返回给原调用者。翻译 2023-03-18 20:06:54 · 172 阅读 · 0 评论 -
Apache Druid分析型数据库设计-存储设计
Druid数据存储在数据源中,这和传统关系数据库管理系统的表类似。每个数据源都按事件分区,也能可选地按其它属性进一步分区。每个时间范围叫做chunk。在chunk中,数据被分区成一个或多个段,每个段都是一个文件。本文介绍内容有:1. 数据源(datasource)和段(segment)的概念;2. Indexing和handoff机制;3. 段标识符(segment identifier);4. 段版本控制(segment versioning);5. 段生命周期;6. 可用性和一致性翻译 2023-03-18 20:04:50 · 184 阅读 · 0 评论 -
Apache Druid分析型数据库设计-架构
Druid具有分布式的架构,旨在对云友好且易于操作。您能够对服务独立进行配置和扩展,从而在集群操作上面拥有最大的灵活性。这样的设计具有增强的容错能力,一个组件的中断不会立即影响其它的组件。本文先从Druid的整体架构(architecture)开始介绍,然后介绍组成Druid的多种服务(Service),最后讲述Druid的三个外部依赖,包括深度存储(Deep storage)、元数据存储(Metadata storage)和Zookeeper。翻译 2023-03-18 19:53:24 · 179 阅读 · 0 评论 -
Apache Druid分析型数据库简介
Apache Druid是一个开源的分布式实时分析型数据库,专为对大型数据集进行快速切片和切块分析(“OLAP”查询)而设计。大多数情况下,Druid用于实时摄取(ingestion)、快速查询性能和高正常运行时间很重要的场景。Druid普遍用于分析应用程序GUI或需要快速聚合的高并发API的数据库后端,其最适合处理面向事件的数据。翻译 2023-03-18 19:34:46 · 340 阅读 · 0 评论