access 如果删除相同行-转 sqlite也可

不好意思,之前回答有些笔误。
这么大的数据量,实现楼主这个目的我看可以分步予以实现:
 
a. 如果原始表不含唯一标识字段
第一步 取出原始表(假设表名为“A”)中无重复的记录行,到一个新表中取名“NewA”
运行SQL生成表查询: select distinct *  into NewA from A
即可将原始无重复的记录存入新表“NewA”中
第二步 检查新表中记录无误后,删除原始表
第三步 重命名新表为原始表名,到此大功告成。
 
b. 如果原始表含有唯一标识字段,假设该字段名为“id”,其它字段名为:A,B.C,...
方法1)运行下列查询即可。此法一步完成,但是由于数据量非常大,耗时可能会很长,例如几个小或者十几小时以上等
             delete from A where id not in(select max(id) from A group by A,B,C,...)
方法2)如果原始表唯一标识字段(id)没有特定的意义,则可以这样做以减少耗时
第一步 创建一个新表(NewA),创建唯一标识字段(id)数据类型为自增ID,其它字段与原始表对应字段同名兼同数据类型(即结构一样)
第二步 运行下列追加SQL查询,将原始表中无重复的记录(注意:不含id字段)追加到新表中
            insert into NewA(A,B,C,...) select distinct A,B,C,... from A
第三步 检查新表中记录无误后,删除原始表
第四步 重命名新表为原始表名,到此大功告成。
 
由于方法1)使用"Not In" 运算,数据库引擎完全不能优化,大数据表时效率极低,不建议使用。下面再给出一个不使用“Not”关键字的方法。
方法3)此方法也可以像方法1)一样,一步到位,一次性删除有两条或以上重复的记录,仅保留有重复记录中id 最小的那条记录,其效率要比方法1)高出至少一个数量级。只适合含有唯一标识的数据表(假设数据表有id,A,B,C四个字段,下列语句中T、T1、id1分别是子查询表别名和字段别名)
DELETE FROM A
WHERE id IN(SELECT id FROM 
(SELECT A.id,T.id1 FROM A LEFT JOIN 
(SELECT MIN(id) AS id1 FROM A GROUP BY A,B,C)T 
ON A.id=T.id1)T1 WHERE T1.id1 IS NULL);
 
***请注意:运行上列步骤时,请备份原始ACCESS数据库以免造成数据丢失!!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值