缺货影响门店
背景:
缺货主题表中涉及到该字段的指标不明确,需要重新计算
缺货主题表主键:dt+poi_id+sku_id+hour
方案:
1:从缺货主题表里取出oos_effect_poi_id字段(如果该门店缺货,则该字段为门店ID,否则为null)
2:先按dt+poi+sku进行聚合,对oos_effect_poi_id进行sum。累加如果为null代表sku全天不缺货,否则为缺货
3:然后对oos_effect_poi_id字段进行判断,若不为null为1,否则为0
4:最后按dt+sku粒度对oos_effect_poi_id进行sum
开门(销售)库存
背景:
Fact_stock:库存流水全量事实表( 主键:dt,poi_id,base_sku_id,utime(更新时间) ):存放每隔一段时间商品在门店中的库存量,且如果库存发生变动一定会打印一条数据。0点一定会打印一条数据
Dim_delivery:门店履约基础配置维表 (主键:dt,poi_id):门店每天的开关门时间
最初方案:用fact_stock表关联dim_delivery表取出门店的开门时间,再取出开门时间所对应的每个商品的库存量。
问题:如果刚开门的那个时间点库存量没有变化,那么可能不会打印库存量,那么开门时间库存量就取不到了
解决方案1:
第一步:
方案1:分别取出fact_stock表的更新时间与dim_delivery表的开门时间,再进行union得到总的时间。 – 无法直接获取开门时间了
方案2:用fact_stock表关联dim_delivery表取出门店的开门时间字段,更新时间字段,以及库存量。
第二步:
将fact_stock表中的更新时间(utime)小于等于dim_delivery表中的开门时间的时间段截取出来,然后取出离开门时间最近的一个时间即可得到开门库存。
方案1(开窗效率太慢,舍弃):
(1):判断这个表是否有开门时间,如果有则直接取即可
(2):开窗函数(row number partition by dt,poi_id,base_sku_id order by utime desc rk 从大到小)
(3):取 rk=2就是近似或者等于开门时间了,最后取一下库存即可
方案2:
(1):由于0点必会打印一次,所以可以直接取utime的最大值就是近似或者等于开门时间了,最后取一下库存即可