删除表中重复记录--转自博客园（LazyBee）

最新推荐文章于 2022-10-15 16:27:46 发布

CodingSir

最新推荐文章于 2022-10-15 16:27:46 发布

阅读量653

点赞数

文章标签： sql server insert table delete sql 存储

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/educast/article/details/2895049

版权

最近由于要给旧系统的表中增加主键（SQL Server2000的表），由于旧表中存在重复记录所以导致增加不上，所以需要写一段SQL语句来删除所有的重复记录（就是必须保留重复记录中的一条，维持数据记录的唯一性），我知道园子里大虾多，所以在这里集思广益，看看大家都有什么好的办法：

方法一：
1 为了保证完整性，首先启动一个事务

2 声明一个表变量（在这里使用表变量主要是考虑重复的数据不是很多，同时为了获得更好的性能；当然如果重复的数据特别多，使用临时表是更

好的选择，因为表变量的数据都是存在内存中的，如果数据量大，可能导致内存吃紧。）用于存储重复性的数据，这个需要定义成和源表一样。

3 将重复记录的一条插入到表变量中。

4 删除所有有重复记录的记录

5 将表变量中的记录插入的源表中。

6 如果出错，回滚事务，否则提交事务

以下是相应的 sql 语句块：

1

Begin Tran LazyBee
2

declare @tmp Table
3

(lLIstHeader_id int ,lEncounter_id int ,dtLastUpdate_dt datetime ,
4

sLastUpdate_id char ( 10 ),iConcurrency_id int )
5

6

Insert @tmp (lLIstHeader_id,lEncounter_id,dtLastUpdate_dt,sLastUpdate_id,iConcurrency_id)
7

select lListHeader_id,lEncounter_id,dtLastUpdate_dt,sLastUpdate_id,iConcurrency_id
8

from lstHeaderencounter
9

group by lListHeader_id,lEncounter_id,dtLastUpdate_dt,sLastUpdate_id,iConcurrency_id
10

having count ( * ) > 1
11

12

delete lstHeaderencounter from @tmp d
13

where d.lListHeader_id = lstHeaderencounter.lListHeader_id and
14

d.lEncounter_id = lstHeaderencounter.lEncounter_id
15

16

insert lstHeaderencounter(lLIstHeader_id,lEncounter_id,dtLastUpdate_dt,sLastUpdate_id,iConcurrency_id)
17

select lListHeader_id,lEncounter_id,dtLastUpdate_dt,sLastUpdate_id,iConcurrency_id
18

from @tmp
19

20

if @@error <> 0
21

Begin
22

print ’ roll back ’
23

RollBack Tran LazyBee
24

End
25

else
26

Begin
27

print ’ Success ’
28

Commit Tran LazyBee
29

End
30

我知道这个方法不够通用，因为如果有多个类似重复记录的表存在，将每次都要修改表定义和插入语句的字段内容，不知各位有没有好的方法或意见，大家讨论讨论：）

刚在网上找到另外一些解决方案，感觉也挺不错的

方法二：

1 创建一个临时表，这个临时表的结构和源表一样

2 给这个临时表增加一个唯一索引（根据需要），并且选中忽略重复值

3 将源表的记录全部插入临时表中，这时会因为重复记录出现3604的错误。

4 删除源表的记录，将临时表的记录插入源表中，然后删除临时表。

方法三（主要针对重复记录完全相同的情况）：

1 利用distinct将唯一记录插入临时表中

2 然后将唯一记录再倒回源表中

Select distinct * into #Tmp from tableName

Drop table tableName

Select * into tableName from #Tmp

Drop table #Tmp

方法四（主要针对记录部分字段相同的记录）：

这种方法和方法一有点类似，不过实现方法不同而已。在这里使用了两个临时表.我们假设重复字段为lListHeader_id,lEncounter_id,要求得到这两

个字段的唯一结果集，我们保留重复记录的第一条，当然如果保留重复记录的最后一条可以使用 max 代替 min ：

Select identity ( int , 1 , 1 ) as autoID, * into #Tmp from tableName

Select min (autoID) as autoID into #Tmp2 from #Tmp group by lListHeader_id,lEncounter_id

Select * from #Tmp where autoID in ( Select autoID from #Tmp2)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
删除表中重复记录--转自博客园（LazyBee）

最近由于要给旧系统的表中增加主键（SQL Server2000的表），由于旧表中存在重复记录所以导致增加不上，所以需要写一段SQL语句来删除所有的重复记录（就是必须保留重复记录中的一条，维持数据记录的唯一性），我知道园子里大虾多，所以在这里集思广益，看看大家都有什么好的办法：方法一： 1 为了保证完整性，首先启动一个事务2 声明一个表变量（在这里使用表变量主要是考虑重复的数据
复制链接

扫一扫

CodingSir CSDN认证博客专家 CSDN认证企业博客

码龄19年

812: 原创

2万+: 周排名

201万+: 总排名

1745万+: 访问

: 等级

10万+: 积分

2102: 粉丝

1094: 获赞

926: 评论

3512: 收藏

私信

关注

热门文章

分类专栏

最新评论

各种版本操作系统的虚拟机镜像文件
leeasy: 请问有windows 2000的安装iso吗？
无法解析的外部符号的几种可能（lib方面的）
轻点！: 我是移植的程序，在原电脑正常，新电脑就lib中出现无法解析的外部命令，求救
boost内存池的使用介绍
Frog1228: “void * ordered_malloc(size_type n); Gets the address of a chunk n, allocating new memory if not already available. ” “void * ordered_malloc(); Same as malloc, only merges the free lists, to preserve order.” 所以ordered_malloc(10) 应该是分配了10个int chunk, 这10个int chunk 是合并了空闲链表，并保持它们的顺序，连不连续不一定吧。
boost内存池的使用介绍
Frog1228: 你加个代码高亮会不会更好点
在Windows下安装BIND作为DNS服务器
B510lms: install之后在C:\WINDOWS\system32\找不到dns这个文件夹怎么办呢

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。