如何删除表中重复的wid

最新推荐文章于 2022-04-18 23:44:01 发布

达文西不辅助

最新推荐文章于 2022-04-18 23:44:01 发布

阅读量436

点赞数

分类专栏： sql

本文链接：https://blog.csdn.net/u012102536/article/details/52325752

版权

sql 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

select yhbh,count(wid) from ZC_YH group by yhbh having count(wid)>1;
delete from zc_yh where wid in(select min(wid) from ZC_YH group by yhbh having count(wid)>1);

select yhbh from ZC_YH

方法二：2、rowid
我们在处理一张表中重复记录时经常用到他，当然你也可以用一个很原始的方法，就是将有重复记录的表中的数据导到另外一张表中，最后再倒回去。
SQL>create table stu_tmp as select distinct* from stu;
SQL>truncate table sut;        //清空表记录
SQL>insert into stu select * from stu_tmp;    //将临时表中的数据添加回原表但是要是stu的表数据是百万级或是更大的千万级的，那这样的方法显然是不明智的，因此我们可以根据rowid来处理，rowid具有唯一性，查询时效率是很高的，
例如，学生表中的姓名会有重复的情况，但是学生的学号是不会重复的，如果我们要删除学生表中姓名重复只留学号最大的学生的记录，怎么办呢？
delete from stu a
    where rowid not in (select max(rowid)
                          from stu b
                         where a.name = b.name
                           and a.stno < b.stno);
这样就可以了。

方法三：

2. ROWID的使用——快速删除重复的记录

ROWID是数据的详细地址，通过rowid，oracle可以快速的定位某行具体的数据的位置。

ROWID可以分为物理rowid和逻辑rowid两种。普通的表中的rowid是物理rowid，索引组织表(IOT)的rowid是逻辑rowid。

当表中有大量重复数据时，可以使用ROWID快速删除重复的记录。

举例：

--建表tbl

SQL> create table stu(no number,name varchar2(10),sex char(2));

--添加测试记录

SQL> insert into stu values(1, 'ab',’男’);

SQL> insert into stu values(1, 'bb',’女’);

SQL> insert into stu values(1, 'ab',’男’);

SQL>commit;

删除重复记录方法很多，列出两种。

⑴ 通过创建临时表

可以把数据先导入到一个临时表中，然后删除原表的数据，再把数据导回原表，SQL语句如下：

SQL>create table stu_tmp as select distinct* from stu;

SQL>truncate table sut; //清空表记录

SQL>insert into stu select * from stu_tmp; //将临时表中的数据添加回原表

这种方法可以实现需求，但是很明显，对于一个千万级记录的表，这种方法很慢，在生产系统中，这会给系统带来很大的开销，不可行。

⑵ 利用rowid结合max或min函数

使用rowid快速唯一确定重复行结合max或min函数来实现删除重复行。

SQL>delete from stu a where rowid not in (select max(b.rowid) from stu b where a.no=b.no and a.name = b.name and a.sex = b.sex); //这里max使用min也可以

或者用下面的语句

SQL>delete from stu a where rowid < (select max(b.rowid) from stu b where a.no=b.no and a.name = b.name and a.sex = b.sex); //这里如果把max换成min的话，前面的where子句中需要把"<"改为">"

跟上面的方法思路基本是一样的，不过使用了group by，减少了显性的比较条件，提高效率。

SQL>delete from stu where rowid not in (select max(rowid) from stu t group by t.no, t.name, t.sex );

思考：若在stu表中唯一确定任意一行数据（1, 'ab',’男’），把sex字段更新为”女”，怎么做？

SQL>update stu set sex=’女’ where rowid=(select min(rowid) from stu where no=1 and name=’ab’ and sex=’男’);