从上游爬取的时间字段responseDuration,有三种显示,例如:2小时37分55秒,或者37分55秒,再或者55秒
字段的值是动态的,时分秒,分秒,或者秒,要把这个字段的值拆解,然后换算成秒
思路:考虑使用正则表达式替换函数regexp_replace,把时分秒,先替换成' ', 然后split(间隔符是' ')拆成数组,
然后小时的数乘以3600,分钟的数乘以60
步骤:
1、先替换小时和分,小时和分有可能有,也有可能没有: regexp_replace(responseDuration,'小时|分',' ')
2、秒是一定有的:regexp_replace(regexp_replace(avgResponseDuration,'小时|分',' '),'秒','')
3、如果responseDuration的值是2小时37分55秒,那么替换后的结果是'2 37 55'
4、下一步拆解这个数字串,并利用size函数获取时、分、秒对应的数,然后对应的数乘以对应的秒数
秒是一定有的,则秒是split(time, ' ') [size(split(time, ' ')) -1]
分不一定有,如果为NULL,则置为0,nvl(split(time, ' ') [size(split(time, ' ')) -2], 0) * 60
小时不一定有,如果为NULL,则置为0,nvl(split(time, ' ') [size(split(time, ' ')) -3],0) * 3600
5、综上所述,代码如下:
(select split(time, ' ') [size(split(time, ' ')) -1]
+ nvl(split(time, ' ') [size(split(time, ' ')) -2], 0) * 60
+ nvl(split(time, ' ') [size(split(time, ' ')) -3],0) * 3600
from (
select regexp_replace(regexp_replace(responseDuration,'小时|分',' '),'秒','') as time )
) as responseDuration,