前几天看了一下赛迪网中的SQL板块的文章,讲了如何在SQL Server中快速删除重复记录。我浏览了一下,作者用了四种方法,有建临时表的,用游标的,用唯一索引的,真可谓穷尽其法。然后我BAIDU了一下,才发现原来我用的方法是最简便的。好东西不敢独享...
测试表中的数据如下:
ProductID | ProductName | Unit | UnitPrice |
1 | North | Bottole | 9.0 |
2 | Chang | Bottole | 20.0 |
2 | Chang | Bottole | 20.0 |
3 | Anistreed | G | 1.0 |
4 | Thu | Kg | 2.8 |
4 | Thu | Kg | 2.8 |
4 | Thu | Kg | 2.8 |
产品Chang和Tofu的记录在产品信息表中存在重复。现在要删除这些重复的记录,只保留其中的一条。
目的:删除表中的重复行,每个Product只留下一条记录。假设表名为:TEST
第一步:为原表添加标识列。
Alter Table TEST Add Id int Identity(1,1)
这样,表数据被处理成如下形式
ID | ProductID | ProductName | Unit | UnitPrice |
1 | 1 | North | Bottole | 9.0 |
2 | 2 | Chang | Bottole | 20.0 |
3 | 2 | Chang | Bottole | 20.0 |
4 | 3 | Anistreed | G | 1.0 |
5 | 4 | Thu | Kg | 2.8 |
6 | 4 | Thu | Kg | 2.8 |
7 | 4 | Thu | Kg | 2.8 |
第二步:运行以下SQL 就行了
Delete from TEST Where ID Not In (Select MIN(ID) From TEST Group by ProdutyID )