记一次 SQLServer 分组排序去重分析
row_number() over ( PARTITION BY t1.col_2 ORDER BY 1 )
-- 语句
DELETE FROM table_name t
WHERE t.rowid IN (
SELECT rid
FROM(
SELECT t1.rowid rid,row_number() over ( PARTITION BY t1.col_2 ORDER BY 1 ) rn
FROM table_name t1
) t1
WHERE t1.rn > 1
);
-- PARTITION BY t1.col_2
-- 首先根据第二列进行分组
-- ORDER BY 1
-- 再根据第一列进行排序
-- row_number()
-- 为分组排序后的数据重新分配行编号
-- 类似于一个分组一组编号
-- 比如前两步分了三组
-- row_number()在重新进行编号时会第一组从1开始编号,1.2.3.4....
-- 第二组还是会从1开始编号,1.2.3.4....
-- 以此类推往下
-- WHERE t1.rn > 1
-- 对分组排序后的数据进行过滤,筛选出所有行编号大于1的记录(即重复的记录)
-- 只保留第一个记录,其他大于1的全部筛选后利用 t.rowid IN () 删除,实现去重