http://www.apache-druid.cn
Druid是什么?
Druid是一个实时多维OLAP分析的数据处理系统。它出生于MetaMarkets公司,孵化于Apache。
Druid走ROLAP路线,实时摄取数据,实时出结果。不像Kylin一样有一个显式的预计算过程。
Druid能做什么?
列式存储,好处是查询的时候可以只返回指定的列的数据。
可扩展的分布式架构,可以达到上百台的规模。
并行计算,查询可以并行计算。
数据摄入支持实时和批量。这里实时的意思是输入即可查询。典型的lambda架构。
运维友好。
云原生架构,高容错性。
支持索引,便于快速查询。
基于时间的分区自动聚合。
Druid的适用场景
快速聚合的OLAP分析,实时分析,大数据量,高可用容忍单点故障。
优点:
1)知识流式和批量数据导入
2)lambda架构,将实时数据和历史数据结合
3)高并发亚秒级查询
4)内置查询缓存
5)存储优化,bitmap索引,压缩,字典编码
6)完善的监控
7)支持数据导入上卷。支持灵活的数据存储用于查询时间粒度的配置。
缺点:
1)时间序列数据