1、单列转换成多行
比如:
pageid paged
page1 a,b,c
要转换成
page1 a
page1 b
page1 c
select pageid,p from test lateral view explode(split(paged,',')) adtable as p;
通过split拆成多个元素的集合,再通过explode打散成多行,lateral view作用是解决explode这种UDTF函数拆成的数据不能与其他字段共同服务问题
2、多行转换成单列
即上面的结果又反推回去,想到oracle的sys_connect_path,便写个UDF实现类似功能
import java.util.ArrayList;
import org.apache.hadoop.hive.ql.exec.UDF;
public class RowToCol extends UDF {
private static int MAX_VALUE = 50;
private static String prerows[] = new String[MAX_VALUE];//全局变量,保留上一条记录的值
private static StringBuilder val=null;
public String evaluate (Object ...args){
ArrayList<String> thisrowlist=new ArrayList<String>()

本文总结了Hive中如何进行行列转换,包括单列转多行、多行转单列以及多行转多列、多列转多行的操作。通过split和explode函数实现了单列到多行的转换,利用自定义UDF则可以完成多行到单列的转换。对于更复杂的多行转多列和多列转多行,可以参照相关博文进行操作。
最低0.47元/天 解锁文章
6万+

被折叠的 条评论
为什么被折叠?



