在工作中,我们经常会用到表与表之间的关联来查询数据,当表与表之间的关联字段不是唯一的时候,会出现多对多的关系,那查询出来的结果就会有重复,针对这种情况,就要进行分组取一条。
举例:CUSTOMER_RESTRICTION_LIST 表中的身份证号INDCERTID 字段是可以有多条记录的。
exc_quota 表中的身份证号INDCERTID 字段是可以有多条记录的。
但这两张表只能通过身份证号来进行关联,那势必会有多条重复记录。因为使用
ROW_NUMBER() OVER(PARTITION BY COLUMN1 ORDER BY COLUMN2 DESC)函数的作用是指定COLUMN1(列)进行分区,在分区内指定COLUMN2(列)进行排序,其中PARTITION BY COLUMN 为分区函数。该函数可以用于查询重复数据、去重复查询,删除重复数据。
举例:
select * from (select t., ROW_NUMBER() OVER (PARTITION BY INDCERTID ORDER BY t.createtime desc) NU
from (select cr., e.AMOUNT amount,e.CREATETIME createtime
from CUSTOMER_RESTRICTION_LIST cr
left join exc_quota e on cr.INDCERTID = e.INDCERTID where e.AVAILABLE = ‘1’ and cr.LISTTYPE=‘INACTIVELIST’) t) ta
where ta.NU = 1;
我们拆分来看上面这条sql,
1.先根据INDCERTID 关联CUSTOMER_RESTRICTION_LIST cr 和 exc_quota e 2张表并增加必要的where条件得到 t 表;
2.对第1步中得到的t表查出所有 t.* ,并对t表进行INDCERTID 身份证号分组并且exc_quota e表的创建时间倒序排序得到 ta表。
3.再对分组之后的ta表查出第一条 nu=1