任务:统计从2016102100到2016102510之间,每个小时每个小时biz的次数
材料:
库:db_telecom
固网:ee_weixinbiz_v05
移网:ee_weixinbizfix_v00
表结构:
imsi string
biz string
mid string
idx string
sn string
time string
province string
datatype string
datetime string
# Partition Information
# col_name data_type comment
datetime string
经过分析,这就是一个分组统计任务:sql语句如下:
select t1.biz,count(t1.biz),t1.datatime from (select biz,data_time from weixin_fix where datatime>='2016102100' and datatime<='2016102510') t1 group by biz,datatime;
由于需要结果文件,直接使用hive -f 结合重定向,获取结果文件