Apache Kylin 入门介绍与学习资源

近日 Kylin v2.6.4 版本发布,包含很多问题修复与各种改进。翻阅三年前写的Kylin测试文档,当时版本还是1.5.3。近两年 Kylin 版本迅速迭代,社区不断发展,已经成为 Hadoop 生态中不可或缺的 OLAP 引擎。

01

 Kylin 介绍

Apache Kylin(麒麟)是由eBay开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据。Kylin 能够实现海量数据的秒级甚至亚秒级查询,主要依赖其预计算与构建Cube的能力。

Kylin底层数据存储在HBase中,数据输入与cube building主要是Hive、Kafka,或者JDBC数据源(v2.3.0+版本),如下图所示:

02

 Kylin功能和特性

  • 超快的大数据OLAP引擎,能够降低百亿数据规模下的查询延时。

  • SQL查询能力。支持ANSI SQL查询接口,提供了大部分SQL查询功能。

  • 交互式查询能力。查询延时控制在亚秒级,为Hadoop提供交互式查询能力。

  • 多维立方体。使用kylin为百亿以上数据集定义数据模型并构建立方体。

  • 实时OLAP能力,Kylin可以在数据产生时进行实时处理,用户可以在秒级延迟下进行实时数据的多维分析。

  • BI工具无缝集成,目前能够与 Tableau、PowerBI等工具集成。

03

 相关资源

官方文档

学习 Kylin 建议重点参考官方文档。包含安装部署、Cube构建教程、工具集成等。

http://kylin.apache.org/docs/

另外,Kylin 还提供了中文版官网,如果你阅读英文文档有困难,可以访问:

http://kylin.apache.org/cn/docs/

源码地址

https://github.com/apache/kylin

开发、用户邮件

dev@kylin.apache.org,user@kylin.apache.org

订阅方式:发送邮件到 user-subscribe@kylin.apache.org 或 dev-subscribe@kylin.apache.org 进行订阅。 


往期推荐

1、HBase最佳实践 | 聊聊HBase核心配置参数
2、Apache Hudi:剑指数据湖的增量处理框架
3、Hadoop社区比 Ozone 更重要的事情
4、MapReduce Shuffle 和 Spark Shuffle 结业篇

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值