数据库常见面试题 —— 3. 数据库去重的方法

@北海怪兽

已于 2023-12-26 15:42:27 修改

阅读量554

点赞数

分类专栏：数据库SQL常见面试题文章标签： sql 数据库

于 2022-03-06 22:32:56 首次发布

本文链接：https://blog.csdn.net/gly1653810310/article/details/123319223

版权

数据库SQL常见面试题专栏收录该内容

16 篇文章 32 订阅

订阅专栏

假设有一张学生信息表 StudentInfo ，里面有一些重复信息如下所示：
在这里插入图片描述

--建表
if object_id('StudentInfo','u') is not null drop table StudentInfo
go
create table StudentInfo (
    Student_ID   INT
    ,Student_Name varchar(20)
)
go
insert into StudentInfo
values
(1, 'Emma')
,(2, 'Jack')
,(3, 'Jane')
,(3,'Jane')
,(4, 'Bob')
,(5,'David'    )
,(6,'Isabel'  )
,(7,'Edward'   )
,(7,'Edward'  )
,(8,'Alice'   )
,(8,'Alice'  )
go

数据库去重的方式：
① Distinct
一般用于比较小的表进行去重。

select distinct Student_ID,Student_Name 
from StudentInfo

② Group by
主要用于分组统计，一般在聚合函数中使用。
例如，找出name 字段重复的记录，可以使用以下SQL 语句：

select Student_ID 
FROM StudentInfo 
group by Student_ID 
HAVING COUNT(Student_Name )>1

③ 使用联合查询（union）

select * from StudentInfo
union
select * from StudentInfo

④ row_number() over()

WITH CTE AS (  
  SELECT *, ROW_NUMBER() OVER (PARTITION BY Student_ID ORDER BY Student_ID) as rnK 
  FROM StudentInfo   
)  
DELETE FROM CTE WHERE rn > 1;

⑤ 利用Oracle数据库自带的rowid属性，可以判断是否存在重复记录。
例如，对于a、b字段都重复的记录，只保留最新的一条，可以使用以下SQL语句：

select a, b, max(rowid) from test group by a, b。

删除操作则可以使用：

delete from test where rowid not in (select max(rowid) from test group by a, b)。

@北海怪兽

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录