hive
aaaaamater
这个作者很懒,什么都没留下…
展开
-
hive 函数
1 发现及描述函数show functions;desc function sum;desc function extended sum; 2.聚合函数UDAF从0行到多行的0到多个列的输入,返回单一值:sum() avg() min() max()等,常常与group by语句组合使用。 3.表生成函数UDTF0到多个输入,产生多列或多行输出。 array():一列输入转换为原创 2017-09-13 10:58:57 · 232 阅读 · 0 评论 -
hive over() row_name()的实践
1over后的写法over(order by salary) 按照salary排序进行累计,order by是个默认的开窗函数over(partition by deptno)按照部门分区over(partition by deptno order by salary) 2开窗的窗口范围over(order by salary range between 5 preceding and转载 2017-09-13 15:04:29 · 351 阅读 · 0 评论 -
hive 分区的超级详细解释
一、什么是分区,以及为什么分区?1、分区是储存位置的物理区别,表实质上被分割了;而group by等只是对表进行查询时的非显示区别,实质表并未被分割。2、在Hive Select查询中一般会扫描整个表内容,会消耗很多时间做没必要的工作。有时候只需要扫描表中关心的一部分数据,因此建表时引入了partition概念【注意partition与group by distribute by的区别】。3、分区转载 2017-09-12 22:07:51 · 2029 阅读 · 0 评论