自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Hive SQL 多日留存计算

一、需求留存、留存率是用于反映网站、互联网应用或网络游戏等运营情况的统计指标,因此计算留存、留存率是数据分析及数据工程师是常见的需求。对于求单日的1日、2日、3日、7日等留存指标,相对较为简单;对于分析一段时间内的留存情况,求一段时间内的各日的1日、2日、3日等留存,较为复杂。二、问题分析1.测试数据情况。测试数据包括三个字段,用户id,用户注册日期,用户登陆日期(活跃日期)。测试数据在天粒度已去重。2.求解分析留存:注册用户在N日后的活跃(登录)用户...

2021-10-24 16:56:25 1578

原创 Hive_SQL 一次删除多个分区数据

目录1.删除语法2.元数据及数据存储变化3.示例3.1 单个分区字段表3.1.1 删除单个分区单个分区数据3.1.2 删除单个分区字段多个分区数据3.2多个分区字段表3.2.1 删除多个分区字段 单个分区数据3.2.2 删除多个分区字段 单个字段 多个分区范围数据3.2.3删除多个分区字段 多个字段 多个分区范围数据1.删除语法ALTER TABLE table_name DROP [IF EXISTS] PARTITION partition...

2021-10-16 09:35:55 20170 2

原创 SQL 求用户的连续登陆天数

一、题目描述求解用户登陆信息表中,每个用户连续登陆平台的天数,连续登陆基础为汇总日期必须登陆,表中每天只有一条用户登陆数据(计算中不涉及天内去重)。表描述:user_id:用户的id; sigin_date:用户的登陆日期。二、解法分析注:求解过程有多种方式,下述求解解法为笔者思路,其他解法可在评论区交流。思路: 该问题的突破的在于登陆时间,计算得到连续登陆标识,以标识分组为过滤条件,得到连续登陆的天数,最后以user_id分组,以...

2021-10-07 23:55:02 2612

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除