kylin入门使用
kylin环境安装成功之后,我们就可以在hive当中创建数据库以及数据库表,然后通过kylin来实现数据的查询
1、创建hive数据库以及表并加载以下数据
dept.txt
10 ACCOUNTING 1700
20 RESEARCH 1800
30 SALES 1900
40 OPERATIONS 1700
emp.txt
7369 SMITH CLERK 7902 1980-12-17 800.00 20
7499 ALLEN SALESMAN 7698 1981-2-20 1600.00 300.00 30
7521 WARD SALESMAN 7698 1981-2-22 1250.00 500.00 30
7566 JONES MANAGER 7839 1981-4-2 2975.00 20
7654 MARTIN SALESMAN 7698 1981-9-28 1250.00 1400.00 30
7698 BLAKE MANAGER 7839 1981-5-1 2850.00 30
7782 CLARK MANAGER 7839 1981-6-9 2450.00 10
7788 SCOTT ANALYST 7566 1987-4-19 3000.00 20
7839 KING PRESIDENT 1981-11-17 5000.00 10
7844 TURNER SALESMAN 7698 1981-9-8 1500.00 0.00 30
7876 ADAMS CLERK 7788 1987-5-23 1100.00 20
7900 JAMES CLERK 7698 1981-12-3 950.00 30
7902 FORD ANALYST 7566 1981-12-3 3000.00 20
7934 MILLER CLERK 7782 1982-1-23 1300.00 10
在将以上两份文件上传到node03服务器的/kkb/install路径下,然后执行以下命令,创建hive数据库以及数据库表,并加载数据。
cd /kkb/install/hive-1.1.0-cdh5.14.2/
bin/beeline
创建数据库并使用该数据库
create database kylin_hive;
use kylin_hive;
(1)创建部门表
create external table if not exists kylin_hive.dept(
deptno int,
dname string,
loc int )
row format delimited fields terminated by '\t';
(2)创建员工表
create external table if not exists kylin_hive.emp(
empno int,
ename string,
job string,
mgr int,
hiredate string,
sal double,
comm double,
deptno int)
row format delimited fields terminated by '\t';
(3)查看创建的表
jdbc:hive2://node03:10000> show tables;
OK
tab_name
dept
emp
(4)向外部表中导入数据导入数据
load data local inpath '/kkb/install/dept.txt' into table kylin_hive.dept;
load data local inpath '/kkb/install/emp.txt' into table kylin_hive.emp;
查询结果
jdbc:hive2://node03:10000> select * from emp;
jdbc:hive2://node03:10000> select * from dept;
2、访问kylin浏览器界面,并创建project
直接在浏览器界面访问
http://node02:8066/kylin/login 并登录kylin,用户名 ADMIN,密码KYLIN
点击页面 + 号,来创建工程
输入工程名称以及工程描述
为工程添加数据源
添加数据源表
3、为kylin添加models
3.1、回到models页面
3.2、添加new models
3.3、填写model name之后,继续下一步
3.4、选择事实表
这里就选择emp作为事实表
3.5、添加维度表
添加我们的DEPT作为维度表,并选择我们的join方式,以及join连接字段
3.6、选择聚合维度信息
3.7、选择度量信息
3.8、添加分区信息及过滤条件之后“Save”
4、通过kylin来构建cube
前面我们已经创建了project和我们的models,接下来我们就来构建我们的cube
4.1、页面添加,创建一个new cube
4.2、选择我们的model以及cube name
4.3、添加我们的自定义维度
4.4、添加统计维度
4.5、设置多个分区cube合并信息
因为我们这里是全量统计,不涉及多个分区cube进行合并,所以不用设置历史多个cube进行合并
4.6、高级设置
高级设置我们这里暂时也不做任何设置,后续再单独详细讲解
4.7、额外的其他的配置属性,这里也暂时不做配置
4.8、完成,保存配置
5、构建我们的cube
将我们的cube进行构建
6、对我们的数进行查询
前面构建好了我们的cube之后,接下来我们就可以对我们的数据进行分析
SELECT DEPT.DNAME ,SUM(EMP.SAL) FROM EMP INNER JOIN DEPT ON DEPT.DEPTNO = EMP.DEPTNO GROUP BY DEPT.DNAME
我们会发现,数据的查询速度非常快,马上就可以产出结果了,通过kylin的与计算,已经将我们各种可能性的结果都获取到了,我们这里直接就可以得到我们计算完成的结果,所以结果非常快就能计算出来。