![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hive
卑微的小涛子
这个作者很懒,什么都没留下…
展开
-
hive求活跃天数
需求1:截止到当天的用户连续活跃的天数 需求2:某段时间内用户的连续活跃区间 需求3:某段时间用户的最大连续活跃天数 需求1:截止到当天的用户连续活跃的天数 思路: 按照日期倒序排序,另一个字段为与当天相差的天数,如果连续的话,则前两者之差为1 select uid, "当天", sum(case when rn-day_num=1 then 1 else 0 end ) as active_days from ( select uid, dt, row_number() ov原创 2021-03-28 10:24:47 · 520 阅读 · 0 评论 -
hive升级
升级主要说明: 1.为避免升级前后数据偏差,关闭一切写入表的操作 ,【实际采用了并行执行,并未中断写入,只是copy 一份份元数据,升级后,再回补新数据库缺失的数据】 2.hive升级:2.1–>2.3.7 我们元数据库是mysql 2.1 emr集群上执行以下命令: cd /usr/lib/hive/scripts\metastore\upgrade\mysql/ mysql -h host -P 3306 -u litbaws -p 密码 hive < upgrade-2.1.0-to-.原创 2021-03-01 15:14:04 · 569 阅读 · 0 评论