获取原文
简短介绍
大家好,又到了"福来day"(Friday)。小小的坚持下又可以休息了哦。那么今天先继续分享下关于Apache Kylin方面的知识。
01-Apache Kylin介绍
Apache Kylin是一款OLAP多维分析工具。主要的特点就是以空间换时间的理念。它通过预计数生成Cube(所谓Cube:这里又叫数据立方体。是将数据中可能出现的维度组合预先进行计算,之后存放着。需要时直接定位到结果数据即可)。Kylin就是实现一次计算,多次使用。来提升查询响应速度。对于离线分析查询有很大的帮助,减少了重复计算。在生成Cube后进行查询最快可实现亚秒级响应(在大数据集群中能有这样的响应速度是很逆天的存在哦)。
了解Hive的小伙伴都知道。Hive提交一段查询sql,返回结果是一个比较慢的过程的。如果在sql逻辑不变的情况下,开发成Cube。就能大大节省查询时间,提高工作效率。
说明:从架构图中我们可以看出kylin支持很多数据源(RDBMS、Hive、kafka)。在接收数据之后,进行预计算处理,生成Cube。最终Cube结果数据存入在Hbase中。
02-Apache Kylin实操
前提条件:已具备kylin开发环境。