- 博客(2)
- 资源 (2)
- 收藏
- 关注
原创 Hive 用ROW_NUMBER取每组top n
今天用hive查数据时需要取每个分组的第一条数据,查了一发现hive 已经从0.11.0版本加入row_number函数,可以满足查询的需求。ROW_NUMBER() 是从1开始,按照顺序,生成分组内记录的序列 用法如下: ROW_NUMBER() OVER (partition BY COLUMN_A SORT BY COLUMN_B ASC/DESC) rnrn 是排序的别名执行时每
2017-04-26 19:05:59 13098
原创 impala 导出查询结果到文件
想用impala-shell 命令行中将查询的结果导出到本地文件,想当然的以为impala 和 hive 一样可以用 insert overwrite local directory ‘/home/test.txt’ select ……. 这样的命令导出到本地,执行了一下,发现impala 不支持这个。然后查了一下,发现impala-shell 可以像mysql 一样的方式导出查询结果到文件。在命令
2017-04-01 11:23:26 12714
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人