六十四、Kylin的初体验

本文档详细介绍了如何使用Kylin进行大数据分析。首先,通过需求分析和数据准备展示了如何在Hive中创建dept和emp表。接着,逐步演示了在Kylin中创建项目、选择数据源、构建Model和Cube的过程。最后,触发Cube预计算并进行查询测试,为初学者提供了一站式的Kylin使用教程。
摘要由CSDN通过智能技术生成

上一篇文章我们介绍了Kylin以及Kylin的安装,本文我们通过一个简单的例子来初探一下Kylin的使用。关注专栏《破茧成蝶——大数据篇》,查看更多相关的内容~


目录

一、需求分析

二、数据准备

三、创建Kylin项目

3.1 登录系统

3.2 创建项目

3.3 选择数据源

3.4 创建Model

3.5 创建Cube


一、需求分析

需求:现有员工信息和部门信息两个文件,实现按照部门统计员工工资。

二、数据准备

1、将数据文件上传到服务器中,其目录与数据大体如下图所示:

2、在Hive中创建表

(1)创建dept表并加载数据

create external table if not exists xzw.dept(
dept_no int,
dept_name string,
loc int
)
row format delimited fields terminated by '\t';



load data local inpath '/root/files/dept.txt' into table xzw.dept;

(2)创建emp表并加载数据

create external table if not exists xzw.emp(
emp_no int,
emp_name string,
job string,
mgr int,
hiredate string, 
sal double, 
comm double,
dept_no int)
row format delimited fields terminated by '\t';


load data local inpath '/root/files/emp.txt' into table xzw.emp;

(3)查看表数据

三、创建Kylin项目

3.1 登录系统

输入下面的网址打开Kylin:

http://master:7070/kylin

登录系统:

3.2 创建项目

1、点击“+”创建新的项目:

2、填写项目名称和项目描述,点击提交进行项目创建:

3.3 选择数据源

1、选择加载数据源的方式

2、选择要同步的表,点击同步

3.4 创建Model

1、创建一个New Model

2、添加Model名称和描述点击Next

3、选择事实表

4、添加维度表

5、选择添加的维度表及join字段

6、添加维度信息

7、选择度量信息

8、添加分区信息和过滤信息后选择保存。这里因为是初体验,所以这两种信息暂时先不选

9、Model创建完成

3.5 创建Cube

1、点击New选择New Cube

2、选择Model并填写Cube的名称,点击Next

3、添加维度

4、选择维度

5、添加需要预计算的内容

6、因为本文是初探,下面的设置暂时选择默认,一直点击Next直至完成Cube的创建即可。

7、触发预算

8、点击Monitor查看Build进度

9、构建完成

10、点击Insight查询测试

 

以上就是本文的所有内容,比较简单。你们在此过程中遇到了什么问题,欢迎留言,让我看看你们都遇到了哪些问题~

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

象在舞

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值