前置条件:
安装好hive
背景:
hive表中存有cookieid和time两个字段
目标:
通过rank方法查出每个cookieid在哪一天的次数最多
具体步骤如下:
一、创建表
CREATE EXTERNAL TABLE tmp_dh_topN (
cookieid string,
vtime string --day
) ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
stored as textfile location '/tmp/dh/tmp_dh_topN/';
二、导入数据到表
topN的数据链接: http://download.csdn.net/detail/hua245942641/9355221
数据文件存放在/tmp目录下,把数据导入hive的tmp_dh