- 博客(30)
- 收藏
- 关注
原创 编写sql实现每个用户截止到每月为止的最大单月访问次数和累计到该月的总访问次数
编写sql实现每个用户截止到每月为止的最大单月访问次数和累计到该月的总访问次数
2023-11-07 11:24:54 215
原创 元组、字典、字符串、列表、集合数据类型的区别
需要注意的是,元组、字符串和列表都是序列类型,可以通过索引和切片进行访问和操作。字典和集合是无序的,不能通过索引访问,而是通过键进行访问。此外,元组和字符串是不可变的,即创建后不能进行修改,而字典、列表和集合是可变的,可以动态添加、删除和修改元素。
2023-09-27 20:58:49 315
原创 解决hive中数据倾斜问题
数据倾斜主要指:每个reduce拿到的数据量并不均衡。如何发现:查看每一个reduceTask执行时间,大部分的reduceTask都执行完成了, 只有其中一个或者几个没有执行完成, 此时认为发生了数据倾斜
2023-09-20 09:48:17 498 1
原创 求N日存留率问题
留存率是指在某一时间段内,用户继续使用产品或服务的比例。计算n日留存率的方法是,首先选择一个起始日期作为基准日期,然后计算从该日期起,经过n天后仍然使用产品或服务的用户数量占比。
2023-09-12 20:05:16 19
原创 使用SQL Range操作符进行高级数据分析和筛选
求近三天销售额总和(前两天 + 今天),此时分两种情况,一种是每天都有销售额,第二种是中间某天没有销售额
2023-09-08 10:43:17 271 1
原创 insert overwrite table:数据仓库和数据分析中的常用技术
"INSERT OVERWRITE TABLE:清空和重新加载表中的数据"
2023-09-06 20:16:18 7213 3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人