Hive
aoshan
刚出道不久,才疏学浅,正在成长中...
展开
-
Hive数据处理之一行变多行
直接举例子: hive> select dp_android_dlu, video_android_dlu from video_mertics where p_date=20141204; 4250015 890699 Time taken: 75.391 seconds hive> select dp_android_dlu, p f原创 2017-04-22 15:52:15 · 1942 阅读 · 0 评论 -
Hive分析窗口函数(一) SUM,AVG,MIN,MAX
Hive中提供了越来越多的分析函数,用于完成负责的统计分析。抽时间将所有的分析窗口函数理一遍,将陆续发布。 今天先看几个基础的,SUM、AVG、MIN、MAX。 用于实现分组内所有和连续累积的统计。 Hive版本为 apache-hive-0.13.1 数据准备 CREATE EXTERNAL TABLE lxw1234 (cookieid string,createti转载 2017-04-27 09:38:49 · 294 阅读 · 0 评论 -
Hive分析窗口函数(三) CUME_DIST,PERCENT_RANK
本文中介绍前几个序列函数,NTILE,ROW_NUMBER,RANK,DENSE_RANK,下面会一一解释各自的用途。 Hive版本为 apache-hive-0.13.1 注意: 序列函数不支持WINDOW子句。(什么是WINDOW子句,点此查看前面的文章 ) 数据准备: cookie1,2015-04-10,1cookie1,2015-04-11,5cookie1,2015转载 2017-04-27 09:44:07 · 267 阅读 · 0 评论 -
Hive分析窗口函数(四) LAG,LEAD,FIRST_VALUE,LAST_VALUE
继续学习这四个分析函数。 注意: 这几个函数不支持WINDOW子句。(什么是WINDOW子句,点此查看前面的文章 ) Hive版本为 apache-hive-0.13.1 数据准备: cookie1,2015-04-10 10:00:02,url2cookie1,2015-04-10 10:00:00,url1cookie1,2015-04-10 10:03:04,1url3c转载 2017-04-27 09:48:37 · 251 阅读 · 0 评论 -
Hive分析窗口函数(二) NTILE,ROW_NUMBER,RANK,DENSE_RANK
继续学习这四个分析函数。 注意: 这几个函数不支持WINDOW子句。(什么是WINDOW子句,点此查看前面的文章 ) Hive版本为 apache-hive-0.13.1 数据准备: cookie1,2015-04-10 10:00:02,url2cookie1,2015-04-10 10:00:00,url1cookie1,2015-04-10 10:03:04,1url3c转载 2017-04-27 09:40:41 · 177 阅读 · 0 评论