Kylin
JNSimba
腹有诗书气自华,快叫我长胖一点吧~~~~~
展开
-
Kylin初涉
概述Kylin是一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析能力以支持超大规模数据,可以在亚秒内查询巨大的Hive表与其他引擎对比:Hive、Impala、Presto、Spark-Sql等查询时间是与数据量成正比,数据量非常大的时候,查询性能就下降了。时间复杂度O(N)Kylin:查询时间与数据量无关。时间复杂度O(1)基本概念原创 2017-10-24 19:19:02 · 740 阅读 · 0 评论 -
Kylin分页查询
Kylin可通过两种方式实现分页查询1.客户端界面:select * from test limit 10 offset 1语句表示,从第二条开始,往后查10条2.RestAPI可参考官网实现:http://kylin.apache.org/docs/howto/howto_use_restapi.html#query原创 2017-12-05 19:13:05 · 2966 阅读 · 0 评论 -
Mondrain连接Kylin踩坑
Mondrain踩坑概述采用Flexmonster组件,使用Mondrain通过代理的方式连接Kylin遇到的问题:编写Schema的时候,访问多表时,Mondrain将连接会自动解析为等值连接,类似 select * from A,B where.....但是Kylin不支持这种语法,Kylin支持 select * from A join B on .....同样在saik...原创 2018-01-04 18:37:57 · 1412 阅读 · 2 评论 -
Kylin实践之使用Hive视图
为什么需要使用视图Kylin在使用的过程中使用hive作为cube的输入,但是有些情况下,hive中的表定义和数据并不能满足分析的需求,例如有些列的值需要进行处理,有些列的类型不满足需求,甚至有时候在创建hive表时为了图方便,hive中的所有列都被定义成了string,因此很多情况下在使用Kylin之前需要对hive上的数据格式进行适当的修剪,但是使用alter table的方式修改hive...转载 2018-03-09 14:08:40 · 642 阅读 · 0 评论