Kylin 和 Phoenix 有什么不同？

最新推荐文章于 2023-05-24 08:54:32 发布

肥猫64

最新推荐文章于 2023-05-24 08:54:32 发布

阅读量289

点赞数

本文链接：https://blog.csdn.net/weixin_46403555/article/details/106116730

版权

Apache Kylin和Apache Phoenix都是基于HBase的SQL引擎，但定位不同。Kylin侧重于OLAP，提供亚秒级查询响应和多维分析，适合海量数据交互式分析，而Phoenix更适合OLTP，支持SQL事务操作，适用于高频写入和少量读取的场景。两者在数据存储格式、查询方式和优化上有各自特点，实际应用中应根据业务需求选择。

摘要由CSDN通过智能技术生成

大数据时代，数据的价值越来越被重视，企业从海量大数据中挖掘所需要的信息，用来驱动业务决策以获得更大的商业价值。

与此同时，出现了越来越多的大数据技术帮助企业进行大数据分析，例如 Apache Hadoop，Hive，Spark，Presto，Drill，以及今天我们即将介绍的 Apache Kylin 和 Apache Phoenix 项目等，都是使用 SQL 语言就可以分析大数据，极大地降低了大数据的使用门槛。

这些大数据技术提供 SQL 查询接口，不只是因为 SQL 学习成本低，同时也和 SQL 拥有丰富而强大的表达能力、能满足绝大多数的分析需求的特性有关系。

了解 Apache Kylin 和 Apache Phoenix 的同学都知道，它们都是使用 Apache HBase 做数据存储和查询，那么，同为 HBase 上的 SQL 引擎，它们之间有什么不同呢？下面我们将从这两个项目的介绍开始为大家做个深度解读和比较。

1、Apache Kylin

1.1

Apache Kylin 介绍

Kylin 是一个分布式的大数据分析引擎，提供在 Hadoop 之上的 SQL 接口和多维分析能力（OLAP），可以做到在 TB 级的数据量上实现亚秒级的查询响应。

图1 Kylin 架构

上图是 Kylin 的架构图，从图中可以看出，Kylin 利用 MapReduce/Spark 将原始数据进行聚合计算，转成了 OLAP Cube 并加载到 HBase 中，以 Key-Value 的形式存储。Cube 按照时间范围划分为多个 segment，每个 segment 是一张 HBase 表，每张表会根据数据大小切分成多个 region。Kylin 选择 HBase 作为存储引擎，是因为 HBase 具有延迟低，容量大，使用广泛，API完备等特性，此外它的 Hadoop 接口完善，用户社区也十分活跃。

2、Apache Phoenix

2.1

Apache Phoenix 介绍

Phoenix 是一个 Hadoop 上的 OLTP 和业务数据分析引擎，为用户提供操作 HBase 的 SQL 接口，结合了具有完整 ACID 事务功能的标准 SQL 和 JDBC API，以及来自 NoSQL 的后期绑定，具有读取模式灵活的优点。

下图为 Phoenix 的架构图，从图中可以看出，Phoenix 分为 client 和 server，其中 client 又分为 thin