hive中如何将存在分隔符号的一列进行拆分,成为多行(可参考之前行转列,列转行笔记第三部分)
三、行转列
split()︰将一个字符串按照指定字符分割,结果为一个array
explode():将一列复杂的array或者map拆分为多行,它的参数必须为map或array
lateral view用法: lateral view udtf(字段名)表别名/表临时名as列别名/列临时名
lateral view用于和split, explode等UDTF一起使用,它能够将一行数据拆成多行数据,在此基础上可以对拆分后的数据进行聚合。lateral view首先为原始表的每行调用UDTF,UTDF会把一行拆分成一或者多行,lateralview再把结果组合,产生一个支持别名表的虚拟表。
/*原始数据
province city
河南 郑州市,开封市,洛阳市
河北 石家庄市,保定市,邢台市
湖南 长沙市,岳阳市,常德市
*/
-- addr为表名
select province, city_n from
addr lateral view
explode ( split(city,',' ) ) addr_tmp as city_n;
/*
-- 查询结果
河南 郑州市
河南 开封市
河南 洛阳市
河北 石家庄市
河北 保定市
河北 邢台市
湖南 长沙市
湖南 岳阳市
湖南 常德市
*/
————————————————
版权声明:本文为CSDN博主「小白冲啊」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_41797985/article/details/113505962