前言
数仓或BI开发中,都会涉及到指标开发阶段,针对指标的计算口径,我们通过Hive不同的函数及算法来解决统计问题,当然目前也有很多的BI工具可以通过明细数据进行统计指标,但考虑到BI工具负载过高、深入理解此指标的计算逻辑,我们有必要去通过Hive实践一下。
一、同环比、月度占比指标
(日/周/月/年)同比计算方式:(当期数/同期数-1)*100%
(日/周/月/年)环比计算方式:(当期数/上期数-1)*100%
1.创建表
CREATE TABLE `saleorder` (
`order_id` int ,
`order_time` date ,
`order_num` int
) ;
2.创建数据集
INSERT INTO `saleorder` VALUES
(1, '2020-04-20', 420),
(2, '2020-04-04', 800),
(3, '2020-03-28', 500),
(4, '2020-03-13', 100),
(5, '2020-02-27', 300),
(6, '2020-01-07', 450),
(7, '2019-04-07', 800),
(8, '2019-03-15', 1200),
(9, '2019-02-17', 200),
(10, '2019-02-07', 600),
(11, '2