hive中实现行转列_Hive--行转列(Lateral View explode())和列转行(collect_set() 去重)...

本文介绍了在Hive中如何进行数据转换,包括将多值字段行转列为多个单独记录,以及将多行聚合为一列。通过示例展示了使用`split`、`explode`、`collect_set`和`concat_ws`等函数实现数据转换的方法。
摘要由CSDN通过智能技术生成

1.行转列

1.1 问题引入:

如何将

a       b       1,2,3

c       d       4,5,6

变为:

a       b       1

a       b       2

a       b       3

c       d       4

c       d       5

c       d       6

1.2 原始数据:

test.txt

a b 1,2,3

c d 4,5,6

1.3 解决方法

方案1:

drop table test_jzl_20140701_test;

建表:

create table test_jzl_20140701_test

(

col1 string,

col2 string,

col3 string

)

row format delimited fields terminated by ' '

stored as textfile;

加载数据:

load data local inpath '/home/jiangzl/shell/test.txt' into table test_jzl_20140701_test;

查看表中所有数据:

select * from test_jzl_20140701_test

a       b       1,2,3

c       d       4,5,6

遍历数组中的每一列

select col1,col2,name

from test_jzl_20140701_test

lateral view explode(split(col3,',')) col3 as name;

a       b       1

a       b       2

a       b       3

c       d       4

c       d       5

c       d       6

方案2:

drop table test_jzl_20140701_test1;

建表:

create table test_jzl_20140701_test1

(

col1 string,

col2 string,

col3 array

)

row format delimited

fields terminated by ' '

collection items terminated by ','   //定义数组的分隔符

stored as textfile;

加载数据:

load data local inpath '/home/jiangzl/shell/test.txt' into table test_jzl_20140701_test1;

查看表中所有数据:

select * from test_jzl_20140701_test1;

a       b       [1,2,3]

c       d       [4,5,6]

遍历数组中的每一列:

select col1,col2,name

from test_jzl_20140701_test1

lateral view explode(col3) col3 as name;

a       b       1

a       b       2

a       b       3

c       d       4

c       d       5

c       d       6

1.4补充知识点:

select * from test_jzl_20140701_test;

a       b       1,2,3

c       d       4,5,6

select t.list[0],t.list[1],t.list[2] from (

select (split(col3,',')) list from test_jzl_20140701_test)t;

OK

1       2       3

4       5       6

--查看数组长度

select size(split(col3,',')) list from test_jzl_20140701_test;

3

3

2.列转行

2.1问题引入:

hive如何将

a       b       1

a       b       2

a       b       3

c       d       4

c       d       5

c       d       6

变为:

a       b       1,2,3

c       d       4,5,6

2,2原始数据:

test.txt a       b       1

a       b       2

a       b       3

c       d       4

c       d       5

c       d       6

2.3 解决方法:

drop table tmp_jiangzl_test;

建表:

create table tmp_jiangzl_test

(

col1 string,

col2 string,

col3 string

)

row format delimited fields terminated by '\t'

stored as textfile;

加载数据:

load data local inpath '/home/jiangzl/shell/test.txt' into table tmp_jiangzl_test;

处理:

select col1,col2,concat_ws(',',collect_set(col3))

from tmp_jiangzl_test

group by col1,col2;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值