MySQL 数据库中删除重复记录的方法总结

原帖 http://www.codebit.cn/mysql/deleting-duplicate-rows-in-a-mysql-database.html


演示数据

表结构:

1
2
3
4
5
6
7
8
mysql> desc demo;
+ -------+------------------+------+-----+---------+----------------+
| Field | Type             | Null | Key | Default | Extra          |
+ -------+------------------+------+-----+---------+----------------+
| id    | int (11) unsigned | NO   | PRI | NULL    | auto_increment |
| site  | varchar (100)     | NO   | MUL |         |                |
+ -------+------------------+------+-----+---------+----------------+
2 rows in set (0.00 sec)

数据:

1
2
3
4
5
6
7
8
9
10
11
mysql> select * from demo order by id;
+ ----+------------------------+
| id | site                   |
+ ----+------------------------+
|  1 | http://www.CodeBit.cn  |
|  2 | http://YITU.org        |
|  3 | http://www.ShuoWen.org |
|  4 | http://www.CodeBit.cn  |
|  5 | http://www.ShuoWen.org |
+ ----+------------------------+
5 rows in set (0.00 sec)

当没有创建表或创建索引权限的时候,可以用下面的方法:

如果你要删除较旧的重复记录,可以使用下面的语句:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
mysql> delete from a
     -> using demo as a, demo as b
     -> where (a.id > b.id)
     -> and (a.site = b.site);
Query OK, 2 rows affected (0.12 sec)
 
mysql> select * from demo order by id;
+ ----+------------------------+
| id | site                   |
+ ----+------------------------+
|  1 | http://www.CodeBit.cn  |
|  2 | http://YITU.org        |
|  3 | http://www.ShuoWen.org |
+ ----+------------------------+
3 rows in set (0.00 sec)

如果你要删除较新的重复记录,可以使用下面的语句:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
mysql> delete from a
     -> using demo as a, demo as b
     -> where (a.id < b.id)
     -> and (a.site = b.site);
Query OK, 2 rows affected (0.12 sec)
 
mysql> select * from demo order by id;
+ ----+------------------------+
| id | site                   |
+ ----+------------------------+
|  2 | http://YITU.org        |
|  4 | http://www.CodeBit.cn  |
|  5 | http://www.ShuoWen.org |
+ ----+------------------------+
3 rows in set (0.00 sec)

你可以用下面的语句先确认将被删除的重复记录:

1
2
3
4
5
6
7
8
9
10
11
mysql> SELECT a.*
     -> FROM demo a, demo b
     -> WHERE a.id > b.id
     -> AND (a.site = b.site);
+ ----+------------------------+
| id | site                   |
+ ----+------------------------+
|  1 | http://www.CodeBit.cn  |
|  3 | http://www.ShuoWen.org |
+ ----+------------------------+
2 rows in set (0.00 sec)

如果有创建索引的权限,可以用下面的方法:

在表上创建唯一键索引:

1
2
3
4
5
6
7
8
9
10
11
12
13
mysql> alter ignore table demo add unique index ukey (site);
Query OK, 5 rows affected (0.46 sec)
Records: 5  Duplicates: 2  Warnings: 0
 
mysql> select * from demo order by id;
+ ----+------------------------+
| id | site                   |
+ ----+------------------------+
|  1 | http://www.CodeBit.cn  |
|  2 | http://YITU.org        |
|  3 | http://www.ShuoWen.org |
+ ----+------------------------+
3 rows in set (0.00 sec)

重复记录被删除后,如果需要,可以删除索引:

1
2
3
mysql> alter table demo drop index ukey;
Query OK, 3 rows affected (0.37 sec)
Records: 3  Duplicates: 0  Warnings: 0

如果有创建表的权限,可以用下面的方法:

创建一个新表,然后将原表中不重复的数据插入新表:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
mysql> create table demo_new as select * from demo group by site;
Query OK, 3 rows affected (0.19 sec)
Records: 3  Duplicates: 0  Warnings: 0
 
mysql> show tables;
+ ----------------+
| Tables_in_test |
+ ----------------+
| demo           |
| demo_new       |
+ ----------------+
2 rows in set (0.00 sec)
 
mysql> select * from demo order by id;
+ ----+------------------------+
| id | site                   |
+ ----+------------------------+
|  1 | http://www.CodeBit.cn  |
|  2 | http://YITU.org        |
|  3 | http://www.ShuoWen.org |
|  4 | http://www.CodeBit.cn  |
|  5 | http://www.ShuoWen.org |
+ ----+------------------------+
5 rows in set (0.00 sec)
 
mysql> select * from demo_new order by id;
+ ----+------------------------+
| id | site                   |
+ ----+------------------------+
|  1 | http://www.CodeBit.cn  |
|  2 | http://YITU.org        |
|  3 | http://www.ShuoWen.org |
+ ----+------------------------+
3 rows in set (0.00 sec)

然后将原表备份,将新表重命名为当前表:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
mysql> rename table demo to demo_old, demo_new to demo;
Query OK, 0 rows affected (0.04 sec)
 
mysql> show tables;
+ ----------------+
| Tables_in_test |
+ ----------------+
| demo           |
| demo_old       |
+ ----------------+
2 rows in set (0.00 sec)
 
mysql> select * from demo order by id;
+ ----+------------------------+
| id | site                   |
+ ----+------------------------+
|  1 | http://www.CodeBit.cn  |
|  2 | http://YITU.org        |
|  3 | http://www.ShuoWen.org |
+ ----+------------------------+
3 rows in set (0.00 sec)

注意:使用这种方式创建的表会丢失原表的索引信息!

1
2
3
4
5
6
7
8
mysql> desc demo;
+ -------+------------------+------+-----+---------+-------+
| Field | Type             | Null | Key | Default | Extra |
+ -------+------------------+------+-----+---------+-------+
| id    | int (11) unsigned | NO   |     | 0       |       |
| site  | varchar (100)     | NO   |     |         |       |
+ -------+------------------+------+-----+---------+-------+
2 rows in set (0.00 sec)

如果要保持和原表信息一致,你可以使用 show create table demo; 来查看原表的创建语句,然后使用原表的创建语句创建新表,接着使用 insert … select 语句插入数据,再重命名表即可。

当然,如果要避免重复记录,最好的办法还是不要插入重复数据,可以参考本站另外一篇文章:MySQL 当记录不存在时插入(insert if not exists) 。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值