Kylin
文章平均质量分 86
Kylin
Yuan_CSDF
被大数据埋没的销售人才
展开
-
Kylin多维分析引擎(五):Kylin集成Spark、Flink与增量构建
1.集成Spark、Flink:查看官网http://kylin.apache.org/docs/tutorial/cube_spark.html原创 2021-06-20 18:55:39 · 709 阅读 · 2 评论 -
Kylin多维分析引擎(四):Kylin Cude构建流程详解
1.Kylin Cude构建流程1.1.文字描述构建一个中间平表(Hive Table):将Model中的fact表和look up表构建成一个大的Flat Hive Table。 重新分配Flat Hive Tables。 从事实表中抽取维度的Distinct值。 对所有维度表进行压缩编码,生成维度字典。 计算和统计所有的维度组合,并保存,其中,每一种维度组合,称为一个Cuboid。 创建HTable。 构建最基础的Cuboid数据。 利用算法构建N维到0维的Cuboid数据。原创 2021-06-20 12:27:22 · 756 阅读 · 0 评论 -
Kylin多维分析引擎(三):Kylin的安装与使用
1.Kylin的安装 安装可查看官方安全指南:http://kylin.apache.org/cn/docs/install/index.html原创 2021-06-19 23:04:31 · 776 阅读 · 2 评论 -
Kylin多维分析引擎(二):Kylin基本原理与架构
存储领域屡试不爽的办法就是空间换时间:Kylin 通过预计算,把预计算的 Cuboid 存储下来(占用额外的 空间),真正查询的时候基于 Cuboid 中间数据性能成数量级提升。原创 2021-06-19 12:51:52 · 478 阅读 · 0 评论 -
Kylin多维分析引擎(一):Kylin概述
1.定义:Apache Kylin(Extreme OLAP Engine for BigData)是一个开源的分布式分析引擎,为Hadoop等大型分布式数据平台之上的超大规模数据集提供标准SQL查询及多维分析(OLAP)能力,并提供亚秒级的交互式分析功能。它最初由eBay开发并贡献给开源社区。核心特性:为Hadoop提供标准SQL支持(大部分)支持超大数据集(预计算)亚秒级交互式查询(预计算)可伸缩高吞吐(MR、Spark、HBase)BI工具无缝集成特点:开源MOLAP原创 2021-06-18 23:41:16 · 1504 阅读 · 1 评论