![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hive sql 技能
渔好学
微信公众号:渔好学
腾讯数据科学家
展开
-
hive新功能 Cube, Rollup, grouping sets介绍
hive新功能 Cube, Rollup介绍2013年12月08日 14:15:02阅读数:15330说明:hive之cube、rollup,还有窗口函数,在传统关系型数据(oracle、sqlserver)中都是有的,用法都很相似。GROUPING SETSGROUPING SETS作为GROUP BY的子句,允许开发人员在GROUP BY语句后面指定多个统计选项,可以简单理解为多条group ...转载 2018-07-15 21:03:34 · 803 阅读 · 0 评论 -
Hive SQL随机抽样
使用Hive随机抽样 <!-- 文章内容 --> <div data-note-content="" class="show-content"> <div class="show-content-free"> <h1>1 在hive中使用rand简单随机抽原创 2020-07-17 14:39:35 · 512 阅读 · 0 评论 -
统计每天的新老用户,日活,周活,月活
版权声明:转载请注明出处! https://blog.csdn.net/ddxygq/article/details/81391718 最近有一个需求,统计每天的新老用户,日活,周活,月活。 我们每天的增量数据会加入到hive历史数据表中,包含用户访问网站的一些信...转载 2018-10-03 21:28:54 · 7155 阅读 · 0 评论 -
试用HQL抽取出连续登录了K天的用户uid
转:http://www.it165.net/database/html/201408/7854.html昨天群上有人发个阿里的面试题,题目描述大概如下:数据源:用户登录表,只有俩个字段,uid和dt试用HQL抽取出连续登录了K天的用户uid第一个想法就是直接用一个UDF解决,按uid分组,把dt收集起来然后在UDF里面...转载 2018-10-03 21:42:32 · 239 阅读 · 0 评论 -
hive 抽样
在大规模数据量的数据分析及建模任务中,往往针对全量数据进行挖掘分析时会十分耗时和占用集群资源,因此一般情况下只需要抽取一小部分数据进行分析及建模操作。Hive提供了数据取样(SAMPLING)的功能,能够根据一定的规则进行数据抽样,目前支持数据块抽样,分桶抽样和随机抽样,具体如下所示:数据块抽样(tabl...转载 2018-12-18 17:54:45 · 200 阅读 · 0 评论 -
Hive分析函数和窗口函数
Hive分析函数和窗口函数在Hive 0.11之后支持的,扫描多个输入的行计算每行的结果。通常和OVER,PARTITION BY, ORDER BY, WINDOWING配合使用。和传统的分组结果不一样,传统的结果每组中只有一个结果。分析函数的结果会出现多次,和每条记录都连接输出。语法形式如下:Function(arg1,....argn) ...原创 2019-03-11 21:34:03 · 343 阅读 · 0 评论