SQL中删除重复数据问题

需求分析
 数据库中存在重复记录,删除保留其中一条(是否重复判断基准为多个字段)
 

解决方案
 碰到这样的问题我们先分解步骤来看
 创建测试数据
 找到重复的数据
 删除重复的数据并且保留一行

创建测试数据
 我们创建一个人员信息表并在里面插入一些重复的数据。

CREATE TABLE Person(ID INT AUTO_INCREMENT PRIMARY KEY NOT NULL,Name VARCHAR(20) NULL,Age INT NULL,Address VARCHAR(20) NULL,Sex CHAR(2) NULL);
 

INSERT INTO Person(ID,Name,Age,Address,Sex)
VALUES
( 1, '小二', 18, '佛平路18号', '男' ),
( 2, '大四', 19, '佛平路29号', '男' ),
( 3, '老五', 19, '海三路11号', '女' ),
( 4, '小二', 18, '佛平路18号', '男' ),
( 5, '大四', 19, '佛平路29号', '男' ),
( 6, '小二', 18, '佛平路18号', '男' ),
( 7, '老五', 19, '海三路11号', '女' ),
( 8, '六妹', 18, '海三路19号', '女' );
我们发现除了自增长ID不同以为,有几条其他字段都重复的数据出现,符合我们的需求。


找出重复的数据
SELECT MAX(ID) ID  ,
Name,Age,Address,Sex
FROM test.Person
GROUP BY Name,Age,Address,Sex
HAVING COUNT(1)>1;
 我们发现除了自增长ID不同以为,有几条其他字段都重复的数据出现,符合我们的需求。

 HAVING将分组后统计出来的数量大于1的数据行,就是我们要找的重复数据;
 上面用Max函数或者Min函数均可,只是为了保证取出来的数据的唯一性。

删除重复的数据
 其实我们数据库中最后要保留的结果就是第二步中查询出来的数据,我们把其他的数据删除即可。怎么删除呢?我们使用ID来排除。
DELETE  FROM Person 
WHERE  EXISTS
(
SELECT * FROM (
SELECT
MAX(ID) ID,
Name,Age,Address,Sex
FROM test.Person
GROUP BY Name,Age,Address,Sex
HAVING COUNT(1)>1) T
WHERE Person.Name=T.Name
AND Person.Age=T.Age
AND Person.Address=T.Address
AND Person.Sex=T.Sex
AND Person.ID<T.ID
);

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值