Kylin
文章平均质量分 81
GOD_WAR
喜欢钻研大数据、python、机器学习、人工智能...
展开
-
Kylin 面试问题
Kylin 面试问题面试官惨绝人寰输出1.Kylin的优点和缺点?优点:预计算,界面可视化缺点:依赖较多,属于重量级方案,运维成本很高不适合做即席查询预计算量大,非常消耗资源2.Kylin的rowkey如何设计?Kylin rowkey的编码和压缩选择维度在rowkey中顺序的调整,将过滤频率较高的列放置在过滤频率较低的列之前,将基数高的列放置在基数低的列之前。在查询中被用作过滤条件的维度有可能放在其他维度的前面。充分利用过滤条件来缩小在HBase中.原创 2021-01-08 16:04:32 · 1339 阅读 · 0 评论 -
Kylin 2019年度文章合辑
Apache Kylin最受欢迎 Top 10,不容错过!如何在 1 秒内做到大数据精准去重?作者:史少锋 都是 HBase 上的 SQL 引擎,Kylin 和 Phoenix 有什么不同?作者:翟娜 Apache Kylin v3.0.0 正式发布!编辑:倪春恩 从 ES 到 Kylin,斗鱼客户端性能分析平台进化之旅 作者:戴天力 你离可视化酷炫大屏只差一套 K...原创 2020-02-04 08:45:28 · 471 阅读 · 0 评论 -
Apache Kylin 概览
一、什么是 KylinApche Kylin 是 Hadoop 大数据平台上的一个开源 OLAP 引擎。它采用多维立方体(Cube)预计算技术,可以将某些场景下的大数据 SQL 查询速度提升到亚秒级别。相对于之前的分钟乃至小时级别的查询速度。Apache Kylin 也是中国人主导的,第一个 Apche 顶级开源项目,在开源社区有较大影响力。Kylin 对于解决的问题有以下假设:大...原创 2019-12-25 16:28:53 · 308 阅读 · 0 评论 -
Apache Kylin查询性能优化
Apache Kylin™是一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc. 开发并贡献至开源社区,可在亚秒内查询巨大的Hive表。在Apache Kylin的实际部署过程中,SQL查询有时并不能如预期在很短的时间内完成,需要开发人员进行有针对性的分析和优化。在进行分析、优化之前,我们需要先了解Apache...原创 2019-10-30 22:22:50 · 501 阅读 · 0 评论 -
一文读懂Apache Kylin
“麒麟出没,必有祥瑞。” —— 中国古谚语前言 随着移动互联网、物联网等技术的发展,近些年人类所积累的数据正在呈爆炸式的增长,大数据时代已经来临。但是海量数据的收集只是大数据技术的第一步,如何让数据产生价值才是大数据领域的终极目标。Hadoop的出现解决了数据存储问题,但如何对海量数据进行OLAP查询,却一直...原创 2019-10-30 22:16:07 · 299 阅读 · 1 评论 -
Kylin基础教程(二)
OK,那么接上一篇文章,感性认知了Kylin之后,我们先来看一下如何部署Kylin吧。序号也依然沿用上一篇文章的递增。二、Kylin的部署与使用2.1 部署前的准备工作 Kylin的工作默认依赖于Hive,MapReduce,HBase,其中Hive用于对Kylin的业务操作,MapReduce用于构建Cube,HBase用于存储构建好的Cube。所以在开始部署Kylin之前...原创 2019-10-30 22:03:53 · 278 阅读 · 0 评论 -
Kylin基础教程(一)
一、Kylin介绍1.1 现状 Hadoop于2006年初步实现,改变了企业级的大数据存储(基于HDFS)和批处理(主要基于MR)问题,10几年过去了,数据量随着互联网的发展井喷式增长,如何高速、低延迟的分析数据成为后续面临的挑战,辟如我们面临的一些质疑:Hadoop老矣,尚能饭否? 其中也出现过各种各样的框架来协助Hadoop降低访问数据的延迟,比如列存储框架(Colum...原创 2019-10-30 21:56:43 · 2571 阅读 · 0 评论