上一篇文章我们介绍了Kylin以及Kylin的安装,本文我们通过一个简单的例子来初探一下Kylin的使用。关注专栏《破茧成蝶——大数据篇》,查看更多相关的内容~
目录
一、需求分析
需求:现有员工信息和部门信息两个文件,实现按照部门统计员工工资。
二、数据准备
1、将数据文件上传到服务器中,其目录与数据大体如下图所示:
2、在Hive中创建表
(1)创建dept表并加载数据
create external table if not exists xzw.dept(
dept_no int,
dept_name string,
loc int
)
row format delimited fields terminated by '\t';
load data local inpath '/root/files/dept.txt' into table xzw.dept;
(2)创建emp表并加载数据
create external table if not exists xzw.emp(
emp_no int,
emp_name string,
job string,
mgr int,
hiredate string,
sal double,
comm double,
dept_no int)
row format delimited fields terminated by '\t';
load data local inpath '/root/files/emp.txt' into table xzw.emp;
(3)查看表数据
三、创建Kylin项目
3.1 登录系统
输入下面的网址打开Kylin:
http://master:7070/kylin
登录系统:
3.2 创建项目
1、点击“+”创建新的项目:
2、填写项目名称和项目描述,点击提交进行项目创建:
3.3 选择数据源
1、选择加载数据源的方式
2、选择要同步的表,点击同步
3.4 创建Model
1、创建一个New Model
2、添加Model名称和描述点击Next
3、选择事实表
4、添加维度表
5、选择添加的维度表及join字段
6、添加维度信息
7、选择度量信息
8、添加分区信息和过滤信息后选择保存。这里因为是初体验,所以这两种信息暂时先不选
9、Model创建完成
3.5 创建Cube
1、点击New选择New Cube
2、选择Model并填写Cube的名称,点击Next
3、添加维度
4、选择维度
5、添加需要预计算的内容
6、因为本文是初探,下面的设置暂时选择默认,一直点击Next直至完成Cube的创建即可。
7、触发预算
8、点击Monitor查看Build进度
9、构建完成
10、点击Insight查询测试
以上就是本文的所有内容,比较简单。你们在此过程中遇到了什么问题,欢迎留言,让我看看你们都遇到了哪些问题~