1、Apache Kylin概述（kylin权威指南）

最新推荐文章于 2024-07-30 20:42:33 发布

Imflash

最新推荐文章于 2024-07-30 20:42:33 发布

阅读量815

点赞数

分类专栏：看书笔记文章标签： kylin

本文链接：https://blog.csdn.net/Imflash/article/details/101048730

版权

Apache Kylin旨在提供超高速的大数据在线分析处理，通过预计算的Cube技术解决大数据查询时间与数据量线性增长的问题。其工作原理基于MOLAP，预先计算维度和度量的聚合结果，以秒级响应速度服务于BI和可视化工具。Kylin支持标准SQL接口，可处理超大数据集，并具有高吞吐率和可伸缩性。

摘要由CSDN通过智能技术生成

略

Kylin的使命是超高速的大数据OLAP（Online Analytical Processing），也就是要让大数据分析像使用数据库一样简单迅速，用户的查询请求可以在秒内返回，交互式数据分析将以前所未有的速度释放大数据里潜藏的知识和信息，让我们在面对未来的挑战时占得先机。

现有的优秀的SQL on Hadoop工具使用的技术主要是”大规模并行处理（Massive Parallel Processing）“和”列式存储（Columnar Storage）“；无法改变查询时间与数据量成线性增长的现状；

Apache Kylin的工作原理本质上是MOLAP（Multidimensional Online Analytical Processing）Cube，也就是多维立方体分析。这是数据分析中相当经典的理论，在关系数据库年代就已经有了广泛的应用。

简单说，维度就是观察数据的角度。比如电商的销售数据，可以从时间的维度来观察，也可以从时间和地区的维度来观察。统计时可以吧维度值相同的记录聚合在一起，然后应用聚合函数做累加、平均、去重复计数等聚合计算；维度一般是一组离散的值</

关注

专栏目录