1. 概念
- Druid是一个快速的列式分布式的支持实时分析的数据存储系统。它在处理PB级数据、毫秒级查询、数据实时处理方面,比传统的OLAP系统有了显著的性能改进
- 与阿里巴巴的Druid(数据库连接池)没有关系
2. 特点
3. 应用场景
4. 对比
5. 框架原理
- 类似HBase的LSM tree(Log Structure merge)
- 数据从middleManagerNodes(内存中),按照时间排序处理,刷写到Deep Storage(单机为本地磁盘,集群为HDFS)
- 查询数据从BrokerNodes,BrokerNodes可以从内存中(MiddleManagerNodes)或者HDFS(或者磁盘)中读取
- 中间有HistoricalNodes代替了BrokerNodes负责往磁盘或者HDFS中寻找,实现了解耦
- CoordinatorNodes负责对多个HistoricalNodes进