Hive
文章平均质量分 81
沧南
这个作者很懒,什么都没留下…
展开
-
集群间 Hive 数据 迁移 问题
1、 从hive中导出数据至本地目录 insert overwrite local directory '/export/tmp' select * from test1 where create_time = '2013-11-25'; 列数据之间默认以^A隔开。 2、将本地数据上传另一个集群的hdfs原创 2013-11-28 14:27:37 · 5655 阅读 · 0 评论 -
HIVE 查询 SemanticException [Error 10004]
错误查询:select a.create_date ,count(*) from ( select TB1.create_date from TB1 join TB2on ( TB1.wrapperid = TB2.wrapperid and TB1.id=TB2.id ) where TB2.status!='1'原创 2014-08-20 16:13:16 · 44052 阅读 · 2 评论 -
Hive通用型自定义聚合函数(UDAF)
在使用hive进行数据处理时,经常会用到group by语法,但对分组的操作,hive没有mysql支持得好:group_concat([DISTINCT] 要连接的字段 [Order BY ASC/DESC 排序字段] [Separator '分隔符'])hive只有一个collect_set内置函数,返回去重后的元素数组,但我们可以通过编写UDAF,来实现这些功能。原创 2015-05-05 17:26:31 · 19348 阅读 · 4 评论