今天在大数据交流群有个朋友发了一个遇到的新需求,大概是这样的
将表1 转为表2 的格式 其中value最大大概50。表1如下
ID VALUE
001 1
002 3
003 2
004 1
表2如下
ID VALUE
001 1
002 1
002 1
002 1
003 1
003 1
004 1
当然用udtf或者python函数也可以实现
这里是用的对照表
DROP TABLE IF EXISTS t1
;
CREATE TABLE IF NOT EXISTS t1(
id INT
,value INT
)
;
INSERT INTO t1
VALUES (01 ,1 )
;
INSERT INTO t1
VALUES (02 ,3 )
;
INSERT INTO t1
VALUES (03 ,2 )
;
INSERT INTO t1
VALUES (04 ,1 )
;
CREATE TABLE nums(
num INT
)
;
INSERT INTO nums
VALUES (
1 )
;
INSERT INTO nums
VALUES (
2 )
;
INSERT INTO nums
VALUES (
3 )
;
INSERT INTO nums
VALUES (
4 )
;
INSERT INTO nums
VALUES (
5 )
;
最终的sql如下得到表t2
SELECT
tmp1.id
,1
FROM t1 tmp1
JOIN nums
WHERE tmp1.value>= nums.num
ORDER BY id
;
有更好的思路可以沟通哈。