Doris:使用表函数explode实现array字段列转行

使用场景

  • 我们的大数据数据库,由clickhouse换成了doris
  • 我们有一张路口指标表,安全指标表,记录整个路口周期级别的安全指标,包括路口级的指标和各个进口的部分指标,都在一条记录里
  • clickhouse原有的array字段,可以使用arrayJoin函数实现列转行,有兴趣的可以看下我的这篇博文:ClickHouse嵌套类型使用案例:使用Array和Tuple(或Nested)表示交通干线指标场景
  • doris没有arrayJoin函数,但也有实现列转行的方法

相关知识点介绍

  • 一句话总结:Doris宽表怎么转成高表,就是借助Lateral view

explode

  • 官方文档地址:主页 > SQL 手册 > SQL 函数 > 表函数 > EXPLODE
  • 表函数,需配合 Lateral View 使用。将 array 列展开成多行。当 arrayNULL或者为空时,explode_outer 返回NULLexplodeexplode_outer 均会返回 array 内部的NULL元素。
  • 如果不支持向量化引擎,先设置一下set enable_vectorized_engine = true

split_by_string

SELECT split_by_string('1,2,3,4',',') 

在这里插入图片描述

lateral view

  • 官方文档地址:主页 > 进阶使用 > 行转列
  • 与生成器函数(例如 EXPLODE)结合使用,将生成包含一个或多个行的虚拟表。 LATERAL VIEW 将行应用于每个原始输出行
  • 使用lateral view explode分隔数组
SELECT e1 FROM (SELECT * FROM dwd_signal_securityindex_ri  order by time_stamp desc limit 1) as t lateral view explode(approach_index) tmp1 as e1;

在这里插入图片描述

具体实现和SQL

  • 原始数据
    在这里插入图片描述

lateral view explode列转行


SELECT time_stamp, intersection_number, safety_factor,sub FROM dwd_signal_securityindex_ri as t lateral view explode ( approach_index ) tbl1 AS sub;

在这里插入图片描述

SPLIT_BY_STRING拆分字符串为数组


SELECT
	time_stamp,
	intersection_number,
	safety_factor,
	SPLIT_BY_STRING ( sub, '-' ) arr 
FROM
	( SELECT time_stamp, intersection_number, safety_factor, sub FROM dwd_signal_securityindex_ri AS t lateral VIEW explode ( approach_index ) tbl1 AS sub ) aaa;

在这里插入图片描述

element_at获取数据

SELECT
	time_stamp,
	intersection_number,
	element_at ( arr, 1 ) AS approach,
	element_at ( arr, 2 ) AS pedestrianTimeGuaranteeRate ,
	element_at ( arr, 3 ) AS pedestrianIllegalRate ,
	element_at ( arr, 4 ) AS trafficConflict 
FROM
	(
	SELECT
		time_stamp,
		intersection_number,
		SPLIT_BY_STRING ( sub, '-' ) arr 
	FROM
		( SELECT time_stamp, intersection_number, safety_factor, sub FROM dwd_signal_securityindex_ri AS t lateral VIEW explode ( approach_index ) tbl1 AS sub ) aaa 
	) bbb

在这里插入图片描述

创建视图

  • 查询SQL写好后,可以创建视图,后续直接查询该视图即可
-- 路口进口级别,安全指标
DROP VIEW IF EXISTS `signal`.dwd_signal_securityindex_ri_view;
CREATE VIEW `signal`.dwd_signal_securityindex_ri_view AS
SELECT
	time_stamp,
	intersection_number,
	CAST(element_at ( arr, 1 ) AS DECIMAL(2,0)) AS approach,
	CAST(element_at ( arr, 2 ) AS DECIMAL(10,2)) AS pedestrian_time_guarantee_rate ,
	CAST(element_at ( arr, 3 ) AS DECIMAL(10,2)) AS pedestrian_illegal_rate ,
	CAST(element_at ( arr, 4 ) AS DECIMAL(5,0)) AS traffic_conflict 
FROM
	(
	SELECT
		time_stamp,
		intersection_number,
		SPLIT_BY_STRING ( sub, '-' ) arr 
	FROM
		( SELECT time_stamp, intersection_number, safety_factor, sub FROM dwd_signal_securityindex_ri AS t lateral VIEW explode ( approach_index ) tbl1 AS sub ) aaa 
	) bbb
  • 29
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

坚持是一种态度

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值