Apache Druid 0.19.0 发布了。Druid 是一个分布式的、支持实时多维 OLAP 分析的数据处理系统。它既支持高速的数据实时摄入处理,也支持实时且灵活的多维数据分析查询。因此 Druid 最常用的场景就是大数据背景下、灵活快速的多维 OLAP 分析。 另外,Druid 还有一个关键的特点:它支持根据时间戳对数据进行预聚合摄入和聚合分析,因此也有用户经常在有时序数据处理分析的场景中用到它。
此版本包含约 200 项新特性、bug 修复、性能增强、文档改进和附加测试。主要的新特性和改进包括:
默认启用 GroupBy 和 Timeseries 矢量化查询引擎
支持 Apache Avro 对象容器文件的 Druid 本机批处理支持
更新了对 SQL 数据库的 Druid 本机批处理支持
基于 Apache Ranger 的授权
阿里巴巴对象存储服务支持
Google Compute Engine 提取 worker 自动缩放