spark sql
文章平均质量分 94
浩海紫冰
c爱好者。时间
展开
-
数据仓库笔试题-pdd
题目:商品活动表 goods_activity,字段id主键、goods_id 商品id,act_id 活动id,create_time 活动创建时间 、status 上线状态2 上线 ,3 下线问题一、每个活动的每个商品 的开始时间和结束时间?问题二、假设数据中有脏数据,同一个活动可能 两次上线,也可能两次结束,需要把活动上线重复的状态按照时间取第一条,结束上线状态重复的按时间取最后一条。-- 第一题:-- id,goods_id,act_id,create_time-- asdf3..原创 2020-10-20 23:41:15 · 1552 阅读 · 0 评论 -
大数据开发 之 留存类统计写法
问题:统计活跃用户的近7天、30天留存率?这个是数据仓库开发同学基本都会遇到的问题,属于留存类问题,实现方式也有很多种类,但是在大数据场景下的效率差距很大,因此整理自己写过四种输出留存的方式和对比下优劣。原创 2020-09-13 17:06:43 · 1144 阅读 · 0 评论