Hive指标统计篇

本文介绍了如何在Hive中实现数据仓库或BI开发中的同环比和月度占比指标计算。通过示例创建表格、插入数据,然后展示了使用Hive SQL的不同方法,包括窗口函数、内连接和LAG/LEAD函数来计算这些指标。此外,还讨论了不同写法的优缺点,并提供了参考链接。
摘要由CSDN通过智能技术生成

前言 

数仓或BI开发中,都会涉及到指标开发阶段,针对指标的计算口径,我们通过Hive不同的函数及算法来解决统计问题,当然目前也有很多的BI工具可以通过明细数据进行统计指标,但考虑到BI工具负载过高、深入理解此指标的计算逻辑,我们有必要去通过Hive实践一下。

一、同环比、月度占比指标

(日/周/月/年)同比计算方式:(当期数/同期数-1)*100%
(日/周/月/年)环比计算方式:(当期数/上期数-1)*100%

1.创建表

CREATE TABLE `saleorder`  (
  `order_id` int ,
  `order_time` date ,
  `order_num` int
) ;

2.创建数据集

INSERT INTO `saleorder` VALUES 
(1, '2020-04-20', 420),
(2, '2020-04-04', 800),
(3, '2020-03-28', 500),
(4, '2020-03-13', 100),
(5, '2020-02-27', 300),
(6, '2020-01-07', 450),
(7, '2019-04-07', 800),
(8, '2019-03-15', 1200),
(9, '2019-02-17', 200),
(10, '2019-02-07', 600),
(11, '2
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值