小白篇(十五):大数据Kylin介绍和使用

获取原文

 

简短介绍


大家好,又到了"福来day"(Friday)。小小的坚持下又可以休息了哦。那么今天先继续分享下关于Apache Kylin方面的知识。

 

01-Apache Kylin介绍

Apache Kylin是一款OLAP多维分析工具。主要的特点就是以空间换时间的理念。它通过预计数生成Cube(所谓Cube:这里又叫数据立方体。是将数据中可能出现的维度组合预先进行计算,之后存放着。需要时直接定位到结果数据即可)。Kylin就是实现一次计算,多次使用。来提升查询响应速度。对于离线分析查询有很大的帮助,减少了重复计算。在生成Cube后进行查询最快可实现亚秒级响应(在大数据集群中能有这样的响应速度是很逆天的存在哦)。

了解Hive的小伙伴都知道。Hive提交一段查询sql,返回结果是一个比较慢的过程的。如果在sql逻辑不变的情况下,开发成Cube。就能大大节省查询时间,提高工作效率。

 

说明:从架构图中我们可以看出kylin支持很多数据源(RDBMS、Hive、kafka)。在接收数据之后,进行预计算处理,生成Cube。最终Cube结果数据存入在Hbase中。

 

 

02-Apache Kylin实操

前提条件:已具备kylin开发环境。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值