如下sql为当前我们的业务库中的一个去重的逻辑。
select * from test_user where (user_id,area_id) in (
select user_id,area_id from test_user where user_id is not null group by user_id,area_id HAVING count(*) > 1
) and id not in (
select SUBSTRING_INDEX(GROUP_CONCAT(id order by a_id desc),',',1) from test_user where user_id is not null group by user_id,area_id HAVING count(*) > 1
)
但是使用该查询发现子查询中的记录并没有被排除掉,也就是NOT IN没有生效,但是我们用到该子查询去查询的时候也的确是有数据的。并且ID列为主键不存在为NULL的情况
解决办法:
将该子查询查出的ID填入到临时表中,再NOT IN这张临时表,查询正常
子查询不用a_id排序,使用max()函数如下,查询也正常
select max(id) from test_user where user_id is not null group by user_id,area_id HAVING count(*) > 1