CDH+Kylin三部曲之三：Kylin官方demo

最新推荐文章于 2024-08-27 14:44:27 发布

m0_69377236

最新推荐文章于 2024-08-27 14:44:27 发布

阅读量69

点赞数

分类专栏： Java 文章标签：经验分享面试 java

本文链接：https://blog.csdn.net/m0_69377236/article/details/124295706

版权

Java 专栏收录该内容

62 篇文章 0 订阅

订阅专栏

SSH登录CDH服务器
切换到hdfs账号：su - hdfs
执行导入命令：${KYLIN_HOME}/bin/sample.sh
导入成功，控制台输出如下：

在这里插入图片描述

[](()检查数据

检查数据，执行beeline进入会话模式(hive官方推荐用beeline取代Hive CLI)：

在这里插入图片描述

在beeline会话模式输入链接URL：!connect jdbc:hive2://localhost:10000，按照提示输入账号hdfs，密码直接回车：

在这里插入图片描述

用命令show tables查看当前的hive表，已建好：

![在这里插入图片描述](https://img-blog.csdnimg.cn/2020041 Java开源项目【ali1024.coding.net/public/P7/Java/git】 1141515814.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2JvbGluZ19jYXZhbHJ5,size_16,color_FFFFFF,t_70)

查出订单的最早和最晚时间，后面构建Cube的时候会用到，执行SQL：select min(PART_DT), max(PART_DT) from kylin_sales; ，可见最早2012-01-01，最晚2014-01-01，整个查询耗时18.87秒：

![在这里插入图片描述](https://img-blog.csdnimg.cn/20200411141600766.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,te 《一线大厂Java面试题解析+后端开发学习笔记+最新架构讲解视频+实战项目源码讲义》开源 xt_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2JvbGluZ19jYXZhbHJ5,size_16,color_FFFFFF,t_70)

[](()构建Cube：

数据准备完成，可以构建Kylin Cube了：

登录Kylin网页：http://192.168.50.134:7070/kylin
加载Meta数据，如下图：

在这里插入图片描述

如下图红框所示，数据加载成功：

在这里插入图片描述

在Model页面可以看到事实表和维度表，如下图的操作可以创建一个MapReduce任务，计算维度表KYLIN_ACCOUNT每个列的基数(Cardinality)：

在这里插入图片描述

去Yarn页面(CDH服务器的8088端口)，如下图，可见有个MapReduce类型的任务正在执行中：

在这里插入图片描述

上述任务很快就能完成(10多秒)，此时刷新Kylin页面，可见KYLIN_ACCOUNT表的Cardinality数据已经计算完成了（hive查询得到ACCOUNT_ID数量是10000，但下图的Cardinality值为10420，Kylin对Cardinality的计算采用的是HyperLogLog的近似算法，与精确值有误差，其他四个字段的Cardinality与Hive查询结果一致）：

在这里插入图片描述

接下来开始构建Cube：

在这里插入图片描述

日期范围，刚才Hive查询结果是2012-01-01到2014-01-01，注意截止日期要超过2014-01-01：

在这里插入图片描述

在Monitor页面可见进度：

在这里插入图片描述

去Yarn页面(CDH服务器的8088端口)，可以看到对应的任务和资源使用情况：

在这里插入图片描述

最后

我还为大家准备了一套体系化的架构师学习资料包以及BAT面试资料，供大家参考及学习

已经将知识体系整理好（源码，笔记，PPT，学习视频）

在这里插入图片描述

0)]

[外链图片转存中…(img-S11RojSa-1650433562181)]

[外链图片转存中…(img-ekmc0X4i-1650433562181)]

m0_69377236

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CDH+Kylin三部曲之三：Kylin官方demo

SSH登录CDH服务器切换到hdfs账号：su - hdfs执行导入命令：${KYLIN_HOME}/bin/sample.sh导入成功，控制台输出如下：[](()检查数据检查数据，执行beeline进入会话模式(hive官方推荐用beeline取代Hive CLI)：在beeline会话模式输入链接URL：!connect jdbc:hive2://localhost:10000，按照提示输入账号hdfs，密码直接回车：用命令show tables查看当前..
复制链接

扫一扫