一、简介
Apache Druid是一个实时分析数据库,旨在对大型数据集进行快速的切片和分析(“ OLAP ”查询)。
二、常用领域
- 点击流分析(网络和移动分析)
- 网络遥测分析(网络性能监控)
- 服务器指标存储
- 供应链分析(制造指标)
- 应用程序性能指标
- 数字营销/广告分析
- 商业智能/ OLAP
三、主要功能
- 列式存储格式。Druid使用面向列的存储,这意味着它仅需要加载特定查询所需的确切列。这极大地提高了仅命中几列的查询的速度。此外,每列都针对其特定数据类型进行了优化存储,从而支持快速扫描和聚合。
- 可扩展的分布式系统。Druid通常部署在数十到数百台服务器的群集中,并且可以提供每秒数百万条记录的接收速率,数万亿条记录的保留以及亚秒级到几秒的查询延迟。
- 大规模并行处理。Druid可以在整个集群中并行处理查询。
- 实时或批量摄取。德鲁伊可以实时(批量获取被查询的数据)或批量提取数据。
- 自我修复,自我平衡,易于操作。作为操作员,要扩展或扩展集群,只需添加或删除服务器,集群就会在后台自动重新平衡自身,而不会造成任何停机。如果任何Druid服务器出现故障,系统将自动绕过损坏,直到可以更换这些服务器为止。Druid设计为24/7全天候运行,而无需出于任何原因而导致计划内停机,包括配置