Apache Kylin 入门介绍与学习资源

最新推荐文章于 2021-02-23 10:45:50 发布

大数据技术架构

最新推荐文章于 2021-02-23 10:45:50 发布

阅读量208

点赞数

分类专栏： Kylin

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011598442/article/details/102577754

版权

Kylin 专栏收录该内容

6 篇文章 2 订阅

订阅专栏

近日 Kylin v2.6.4 版本发布，包含很多问题修复与各种改进。翻阅三年前写的Kylin测试文档，当时版本还是1.5.3。近两年 Kylin 版本迅速迭代，社区不断发展，已经成为 Hadoop 生态中不可或缺的 OLAP 引擎。

01

Kylin 介绍

Apache Kylin（麒麟）是由eBay开源的分布式分析引擎，提供Hadoop/Spark之上的SQL查询接口及多维分析（OLAP）能力以支持超大规模数据。Kylin 能够实现海量数据的秒级甚至亚秒级查询，主要依赖其预计算与构建Cube的能力。

Kylin底层数据存储在HBase中，数据输入与cube building主要是Hive、Kafka，或者JDBC数据源（v2.3.0+版本），如下图所示：

02

Kylin功能和特性

超快的大数据OLAP引擎，能够降低百亿数据规模下的查询延时。
SQL查询能力。支持ANSI SQL查询接口，提供了大部分SQL查询功能。
交互式查询能力。查询延时控制在亚秒级，为Hadoop提供交互式查询能力。
多维立方体。使用kylin为百亿以上数据集定义数据模型并构建立方体。
实时OLAP能力，Kylin可以在数据产生时进行实时处理，用户可以在秒级延迟下进行实时数据的多维分析。
BI工具无缝集成，目前能够与 Tableau、PowerBI等工具集成。

03

相关资源

官方文档

学习 Kylin 建议重点参考官方文档。包含安装部署、Cube构建教程、工具集成等。

http://kylin.apache.org/docs/

另外，Kylin 还提供了中文版官网，如果你阅读英文文档有困难，可以访问：

http://kylin.apache.org/cn/docs/

源码地址

https://github.com/apache/kylin

开发、用户邮件

dev@kylin.apache.org，user@kylin.apache.org

订阅方式：发送邮件到 user-subscribe@kylin.apache.org 或 dev-subscribe@kylin.apache.org 进行订阅。

往期推荐

1、HBase最佳实践 | 聊聊HBase核心配置参数
2、Apache Hudi：剑指数据湖的增量处理框架
3、Hadoop社区比 Ozone 更重要的事情
4、MapReduce Shuffle 和 Spark Shuffle 结业篇

大数据技术架构

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

大数据技术架构

博客等级

码龄11年

58
原创

174
点赞

1283
收藏

489
粉丝

关注

私信

热门文章

分类专栏

OLAP 1篇
Hadoop 3篇
Druid 1篇
HBase 32篇
实时数仓 5篇
数据湖Hudi/Iceberg/Delta 20篇
Kafka 14篇
Spark 12篇
Flink 16篇
Elasticsearch 15篇
HDFS 3篇
Hive 4篇
Parquet 2篇
ClickHouse 6篇
Zookeeper 2篇
Kylin 6篇
Impala 1篇
技术随笔 6篇

最新评论

Flink CDC结合Doris flink connector实现Mysql数据实时入Apache Doris
m0_62141512: 同步速度可以控制吗
Flink CDC结合Doris flink connector实现Mysql数据实时入Apache Doris
wo1901446409: 怎么保证 mysql doris数据最终一致性的
HBase 不同压缩方式介绍
WebTuBe: 大佬，你这是什么版本？我是cdh632版本的hbase210，现在不确定需不需要disable表，在cdh和hbase的site文件中也没有查到hbase.online.schema.update.enable这个参数
《Hadoop HDFS深度剖析与实践》新书推荐与回馈新书活动 | 回馈赠书
麦兜和小可的舅舅: 感谢祝江华的辛勤力作。我自己看了一下书的目录，特别吸引我的地方是 1. 从目录来看，这本书几乎是一本HDFS的百科全书，非常全面，无所不包 2.这本书基于社区3.0 hadoop，很难得。 3. 目录中的确列出了很多3.0 hadoop的新特性，让我非常感兴趣，比如纠偏码，Router-based Federation，这些都是特别有价值的feature并且在书中有介绍。 4.这本书的深度非常适合我这个从事hdfs好几年的人，原理，代码都有，而不是像很多HDFS的书籍一样，总是在入门，总是在概念层面泛泛而谈。
HBase 性能测试之读写P999延时压测实践
weixin_47047295: 写入大量数据是ssh容易断开，写入失败怎么解决

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。