自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 最近14天内连续3天购买(断两天也算连续)的用户

话不多说,直接上题目有一个订单表,里面装载的是各个用户的下单信息,表结构如下create table orders( id string, order_date string) row format delimited fields terminated by ',';数据如下这里的最近14天内指的是"2020-03-07" ~ "2020-03-20"1.请统计最近14天内连续3天购买的用户,以及连续购买的最大天数2.请统.

2021-09-29 10:48:48 680 1

原创 hive中的缓慢变化维之拉链表

一、前言数据仓库中数据的同步策略:1)增量同步:增量同步适用于那些数据量比较大,并且之前的数据不发生变化的数据,储存的是新增加的数据;2)全量同步:存储的是所有的数据,适用于那些数据量不是很大但是每天都会发生变化的数据,在数据仓库中,如果按照天进行分区,那么每个分区储存的数据就是截止到当天分区的所有的数据,此时要想查询所有数据的话只需要查询当前最新一天分区数据即可;3)新增及变化同步:存储创建时间和操作时间都是今天的数据,适用于那些数据量比较大,既会有新增也会有变化的数据;4)特殊同步策

2021-09-23 15:28:56 857 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除