kylin入门使用

最新推荐文章于 2024-05-29 12:37:56 发布

TUJC

最新推荐文章于 2024-05-29 12:37:56 发布

阅读量985

点赞数 2

分类专栏： Hadoop生态框架

本文链接：https://blog.csdn.net/TU_JCN/article/details/108087571

版权

Hadoop生态框架专栏收录该内容

60 篇文章 8 订阅

订阅专栏

kylin入门使用

kylin环境安装成功之后，我们就可以在hive当中创建数据库以及数据库表，然后通过kylin来实现数据的查询

1、创建hive数据库以及表并加载以下数据

dept.txt
10	ACCOUNTING	1700
20	RESEARCH	1800
30	SALES	1900
40	OPERATIONS	1700

emp.txt
7369	SMITH	CLERK	7902	1980-12-17	800.00		20
7499	ALLEN	SALESMAN	7698	1981-2-20	1600.00	300.00	30
7521	WARD	SALESMAN	7698	1981-2-22	1250.00	500.00	30
7566	JONES	MANAGER	7839	1981-4-2	2975.00		20
7654	MARTIN	SALESMAN	7698	1981-9-28	1250.00	1400.00	30
7698	BLAKE	MANAGER	7839	1981-5-1	2850.00		30
7782	CLARK	MANAGER	7839	1981-6-9	2450.00		10
7788	SCOTT	ANALYST	7566	1987-4-19	3000.00		20
7839	KING	PRESIDENT		1981-11-17	5000.00		10
7844	TURNER	SALESMAN	7698	1981-9-8	1500.00	0.00	30
7876	ADAMS	CLERK	7788	1987-5-23	1100.00		20
7900	JAMES	CLERK	7698	1981-12-3	950.00		30
7902	FORD	ANALYST	7566	1981-12-3	3000.00		20
7934	MILLER	CLERK	7782	1982-1-23	1300.00		10

在将以上两份文件上传到node03服务器的/kkb/install路径下，然后执行以下命令，创建hive数据库以及数据库表，并加载数据。

cd /kkb/install/hive-1.1.0-cdh5.14.2/
bin/beeline

创建数据库并使用该数据库

create database kylin_hive;
use kylin_hive;

（1）创建部门表

create external table if not exists kylin_hive.dept(
				deptno int,
				dname string,
				loc int )
row format delimited fields terminated by '\t';

（2）创建员工表

create external table if not exists kylin_hive.emp(
empno int,
ename string,
job string,
mgr int,
hiredate string, 
sal double, 
comm double,
deptno int)
row format delimited fields terminated by '\t';

（3）查看创建的表

jdbc:hive2://node03:10000> show tables;
OK
tab_name
dept
emp

（4）向外部表中导入数据导入数据

load data local inpath '/kkb/install/dept.txt' into table kylin_hive.dept;
load data local inpath '/kkb/install/emp.txt' into table kylin_hive.emp;

查询结果

jdbc:hive2://node03:10000> select * from emp;
jdbc:hive2://node03:10000> select * from dept;

2、访问kylin浏览器界面，并创建project

直接在浏览器界面访问
http://node02:8066/kylin/login 并登录kylin，用户名 ADMIN，密码KYLIN

点击页面 + 号，来创建工程
在这里插入图片描述
输入工程名称以及工程描述

为工程添加数据源
在这里插入图片描述

添加数据源表

在这里插入图片描述

3、为kylin添加models

3.1、回到models页面

在这里插入图片描述

3.2、添加new models

在这里插入图片描述

3.3、填写model name之后，继续下一步

在这里插入图片描述

3.4、选择事实表

这里就选择emp作为事实表
在这里插入图片描述

3.5、添加维度表

添加我们的DEPT作为维度表，并选择我们的join方式，以及join连接字段
在这里插入图片描述

3.6、选择聚合维度信息

在这里插入图片描述

3.7、选择度量信息

在这里插入图片描述

3.8、添加分区信息及过滤条件之后“Save”

在这里插入图片描述

4、通过kylin来构建cube

前面我们已经创建了project和我们的models，接下来我们就来构建我们的cube

4.1、页面添加，创建一个new cube

在这里插入图片描述

4.2、选择我们的model以及cube name

在这里插入图片描述

4.3、添加我们的自定义维度

在这里插入图片描述

4.4、添加统计维度

在这里插入图片描述

4.5、设置多个分区cube合并信息

因为我们这里是全量统计，不涉及多个分区cube进行合并，所以不用设置历史多个cube进行合并
在这里插入图片描述

4.6、高级设置

高级设置我们这里暂时也不做任何设置，后续再单独详细讲解
在这里插入图片描述

4.7、额外的其他的配置属性，这里也暂时不做配置

在这里插入图片描述

4.8、完成，保存配置

在这里插入图片描述

5、构建我们的cube

将我们的cube进行构建

在这里插入图片描述

6、对我们的数进行查询

前面构建好了我们的cube之后，接下来我们就可以对我们的数据进行分析

SELECT  DEPT.DNAME ,SUM(EMP.SAL) FROM EMP  INNER JOIN DEPT  ON DEPT.DEPTNO = EMP.DEPTNO  GROUP BY DEPT.DNAME

在这里插入图片描述

我们会发现，数据的查询速度非常快，马上就可以产出结果了，通过kylin的与计算，已经将我们各种可能性的结果都获取到了，我们这里直接就可以得到我们计算完成的结果，所以结果非常快就能计算出来。

TUJC

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
kylin入门使用

、kylin的入门使用我们kylin环境安装成功之后，我们就可以在hive当中创建数据库以及数据库表，然后通过kylin来实现数据的查询第一步：创建hive数据库以及表并加载以下数据dept.txt10 ACCOUNTING 170020 RESEARCH 180030 SALES 190040 OPERATIONS 1700emp.txt7369 SMITH CLERK 7902 1980-12-17 800.00 207499 ALLEN SALESMAN 7698 1981-2
复制链接

扫一扫