Kylin的简单使用

这篇博客介绍了如何在Kylin中创建工程,获取数据源,选择数据表,并解决拉链表和全量表的问题。通过创建模型,构建Cube,并进行测试,详细阐述了在大数据环境下使用Kylin进行数据分析的过程。
摘要由CSDN通过智能技术生成

1. 创建工程

在这里插入图片描述

2. 获取数据源

在这里插入图片描述

3. 选择数据表

选择所需数据表,并点击Sync按钮

在这里插入图片描述

4. 问题

model中的维度表dwd_dim_user_info_his为拉链表、dwd_dim_sku_info为每日全量表,故使用整张表作为维度表,必然会出现订单表中同一个user_id或者sku_id对应多条数据的问题

  1. 在hive中创建维度表的临时表,该临时表中只存放维度表最新的一份完整的数据,在kylin中创建模型时选择该临时表作为维度表。
  1. 与方案一思路相同,但不使用物理临时表,而选用视图(view)实现相同的功能。(采用)
create view dwd_dim_user_info_his_view as select * from dwd_dim_user_info_his where end_date='9999-99-99';

--全量维度表视图
create view dwd_dim_sku_info_view as select * from dwd_dim_sku_info where dt=date_add(current_date,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值