![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hive
hive
画画的老顽童
这个作者很懒,什么都没留下…
展开
-
hive SQL实现占比、同比、环比计算(lag函数,lead函数)
https://blog.csdn.net/qq_36039236/article/details/108279397原创 2021-05-14 10:42:44 · 588 阅读 · 0 评论 -
hive 优化
1、count(distinct ) group by select shop,count(distinct user_id) from visit group by shop; 按照shop 分组,reduce个数与 shop相关 ,每个shop 里执行 count(distinct user_id) 把shop对应的所有的用户信息拿到放到一个reduce中执行 如10个用户,每个用户访问30次, 则每个reduce处理300个记录 select shop,count(*) from原创 2021-03-14 00:25:56 · 101 阅读 · 0 评论 -
数仓常见sql套路
1、新旧数据合并 create external table dwt_uv_topic ( `mid_id` string COMMENT '设备唯一标识', `user_id` string COMMENT '用户标识', `version_code` string COMMENT '程序版本号', `version_name` string COMMENT '程序版本名', `lang` string COMMENT '系统语言', `source` string COMMENT '渠道号', `os`原创 2021-03-12 11:16:06 · 587 阅读 · 0 评论