pl/sql重复记录处理

SQL重复记录查询 
1、查找表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断
select * from people
where peopleId in (select   peopleId from   people group by   peopleId having count(peopleId) > 1)

2、删除表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断,只留有rowid最小的记录
delete from people 
where peopleId in (select   peopleId from people group by   peopleId   having count(peopleId) > 1)
and rowid not in (select min(rowid) from   people group by peopleId having count(peopleId)>1)

3、查找表中多余的重复记录(多个字段) 
select * from vitae a
where (a.peopleId,a.seq) in   (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)

4、删除表中多余的重复记录(多个字段),只留有rowid最小的记录
delete from vitae a
where (a.peopleId,a.seq) in   (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)
and rowid not in (select min(rowid) from vitae group by peopleId,seq having count(*)>1)

5、查找表中多余的重复记录(多个字段),不包含rowid最小的记录
select * from vitae a
where (a.peopleId,a.seq) in   (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)
and rowid not in (select min(rowid) from vitae group by peopleId,seq having count(*)>1)


(二)
比方说在A表中存在一个字段“name”,而且不同记录之间的“name”值有可能会相同,现在就是需要查询出在该表中的各记录之间,“name”值存在重复的项;
        Select Name,Count(*) From A Group By Name Having Count(*) > 1
如果还查性别也相同大则如下:
        Select Name,sex,Count(*) From A Group By Name,sex Having Count(*) > 1
(三)
方法一
declare @max integer,@id integer
declare cur_rows cursor local for select 主字段,count(*) from 表名 group by 主字段 having

count(*) >; 1
open cur_rows
fetch cur_rows into @id,@max
while @@fetch_status=0
begin
select @max = @max -1
set rowcount @max
delete from 表名 where 主字段 = @id
fetch cur_rows into @id,@max
end
close cur_rows
set rowcount 0

方法二

  有两个意义上的重复记录,一是完全重复的记录,也即所有字段均重复的记录,二是部分关键字段重

复的记录,比如Name字段重复,而其他字段不一定重复或都重复可以忽略。

  1、对于第一种重复,比较容易解决,使用
select distinct * from tableName

  就可以得到无重复记录的结果集。

  如果该表需要删除重复的记录(重复记录保留1条),可以按以下方法删除
select distinct * into #Tmp from tableName
drop table tableName
select * into tableName from #Tmp
drop table #Tmp

  发生这种重复的原因是表设计不周产生的,增加唯一索引列即可解决。

  2、这类重复问题通常要求保留重复记录中的第一条记录,操作方法如下

  假设有重复的字段为Name,Address,要求得到这两个字段唯一的结果集
select identity(int,1,1) as autoID, * into #Tmp from tableName
select min(autoID) as autoID into #Tmp2 from #Tmp group by Name,autoID
select * from #Tmp where autoID in(select autoID from #tmp2)

  最后一个select即得到了Name,Address不重复的结果集(但多了一个autoID字段,实际写时可以写

在select子句中省去此列)

(四)查询重复


select * from tablename where id in (select id from tablename group by id having count(id) > 1)

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PL/SQL中,有几种方法可以提高批量操作的性能: 1. 使用FORALL语句进行批量操作:FORALL语句可以用于在单个SQL语句中执行多个绑定变量的批量操作。相比于逐条执行SQL语句,使用FORALL可以减少与数据库的交互次数,从而提高性能。 2. 使用BULK COLLECT语句进行数据集合的批量读取:BULK COLLECT语句可以将查询结果一次性读取到集合中,而不是逐条读取。这样可以减少与数据库的交互次数,提高读取性能。 3. 使用合适的索引:合适的索引可以加速特定条件下的数据库查询。通过分析查询语句和数据访问模式,选择合适的索引可以优化查询性能。 4. 使用合适的数据类型和数据结构:选择合适的数据类型和数据结构可以减少存储空间和I/O操作,从而提高性能。例如,使用紧凑型数据类型(如BINARY_INTEGER)代替大型数据类型(如NUMBER),使用PL/SQL记录类型代替独立的变量等。 5. 使用合适的缓存:缓存可以降低对数据库的访问次数,提高性能。例如,可以使用PL/SQL表或集合来缓存中间结果,避免频繁查询数据库。 6. 优化SQL语句:优化SQL语句可以提高数据库查询的性能。使用合适的查询条件、索引和JOIN语句,避免不必要的数据排序和过滤,可以减少查询时间。 7. 使用合适的事务管理:合理管理事务可以提高批量操作的性能。例如,可以使用适当的事务隔离级别、合理控制事务的范围和持有时间,避免不必要的锁和冲突。 8. 适当处理异常:合理处理异常可以避免不必要的回滚和重复操作,提高性能。使用EXCEPTION子句捕获和处理特定异常,采取合适的补救措施。 这些方法可以根据具体情况选择和组合使用,以提高PL/SQL批量操作的性能。同时,根据实际需求进行性能测试和优化,可以进一步提升性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值