1.概述
Apache Doris是一个现代化的基于MPP(大规模并行处理)技术的分析型数据库产品。简单来说,MPP是将任务并行的分散到多个服务器和节点上,在每个节点上计算完成后,将各自部分的结果汇总在一起得到最终的结果(与Hadoop相似)。仅需亚秒级响应时间即可获得查询结果,有效地支持实时数据分析。
Apache Doris可以满足多种数据分析需求,例如固定历史报表,实时数据分析,交互式数据分析和探索式数据分析等。
1.1核心特征
- 基于MPP(大规模并行处理)架构的分析型数据库
- 性能卓越,PB级别数据毫秒/秒级响应
- 支持标准SQL语言,兼容MySQL协议
- 向量化执行器
- 高效的聚合表技术
- 新型预聚合技术Rollup
- 高性能、高可用、高可靠
- 极简运维,弹性伸缩
1.2Doris特点
(1)性能卓越
(2)简单易用
(3)扩展型强
(4)高可用性
1.3开源OLAP引擎对比
(1)OLTP查询一般只会访问少量的记录,会使用索引
(2)OLAP查询一般需要大量的scan大量数据,大多时候只访问部分列
(3)HTAP混合事务,基于分布式架构,支持弹性扩容,可按需扩展吞吐和存储,轻松应对高并发,海量数据场景。
1.4OLAP分类
(1)MOLAP(kyline):通过预计算,提供稳定的切片数据,实现多次查询一次计算
(2)ROLAP:基于实时的大规模并行计算,对集群要求高。(灵活多维分析,明细+聚合,主键更新)
1.5应用场景