Kylin
许你一个盒
个人博客主页:http://zhenxuexu.github.io
展开
-
Apache Kylin原理学习之Cube构建
Apache Kylin原理简介Apache Kylin是一个开源的、基于Hadoop生态系统的OLAP查询引擎,能够通过SQL接口对十亿、甚至百亿行的超大数据集实现秒级的多维分析查询。Kylin通过预计算实现超大数据集的秒级多维分析查询。对于超大数据集的复杂查询,既然现场计算需要花费较长时间,那么根据空间换时间的原理,我们就可以提前将所有可能的计算结果计算并存储下来,从而实现超大数据集的秒级...转载 2019-05-11 20:37:25 · 446 阅读 · 0 评论 -
Apache Kylin优化之—Cube的高级设置
本文从apachekylin公众号系列文章整理。随着维度数目的增加,Cuboid 的数量会爆炸式地增长。为了缓解 Cube 的构建压力,Apache Kylin 引入了一系列的高级设置,帮助用户筛选出真正需要的 Cuboid。这些高级设置包括聚合组(Aggregation Group)、联合维度(Joint Dimension)、层级维度(Hierachy Dimension)和必要维度(Ma...转载 2019-05-11 20:49:49 · 276 阅读 · 0 评论 -
Apache Kylin 深入Cube和查询优化
前言近几年,Apache Kylin作为一个高速的开源分布式大数据查询引擎正在迅速崛起。它充分发挥Hadoop、Spark、HBase等技术的优势,通过对超大规模数据集进行预计算,实现秒级甚至亚秒级的查询响应时间,同时提供标准SQL接口。目前,Apache Kylin已在全球范围得到了广泛应用,如百度、美团、今日头条、eBay等,支撑着单个业务上万亿规模的数据查询业务。在超高性能的背后,Cube...转载 2019-05-11 21:04:09 · 376 阅读 · 0 评论