SQL练习题三(数据治理之就近取数)
前言:数据治理中难免会有一些脏数据比如空值,我们一般通过取平均值,取众数,取就近数等方法来填补这些空值,这里用到的方法就是取最近值。
现有一张表(时间、值1、值2)如下:
要求:如果某列的字段在该日期为空值,则查询时结果显示为之前最接近日期的非空值
最终图如下:
- 这里注意,由于我们填补的NULL值是该日期之前日期的非空值,由于我们插入的数据没有2021-01-1之前的所以会显示NULL值,是预期现象。
源码:
CREATE TABLE table3
(LDate DATE NOT NULL,
Value1 INT NULL,
Value2 INT NULL
);
INSERT INTO table3 VALUES('2021-01-07', 600 ,400);
INSERT INTO table3 VALUES('2021-01-06', Null,300);
INSERT INTO table3 VALUES('2021-01-05', Null,350);
INSERT INTO table3 VALUES('2021-01-04', 450 ,Null);
INSERT INTO table3 VALUES('2021-01-03', 300 ,320);
INSERT INTO table3 VALUES('2021-01-02', Null,450);
INSERT INTO table3 VALUES('2021-01-01', 250 ,Null);
select * from table3;
sql:
select
a.ldate,
(select value1
from table3 b
where b.ldate<=a.ldate
and b.value1 is not null
order by a.ldate
limit 1) value1,
(select value2
from table3 b
where b.ldate<=a.ldate
and b.value2 is not null
order by a.ldate
limit 1) value2
from table3 a
总结:欢迎有其他方法的小伙伴来讨论!