处理数据库中的重复数据,只保存一条有效数据:
1.新增自增列id
alter table 表名 add _ID int identity (1,1);
PostgresSQL:alter table 表名 ADD id serial ;
PostgreSQL使用序列来标识分区的自增长,数据类型有smallserial,serial和bigserial。这些属性数据库MySQL数据库支持的AUTO_INCREMENT属性。
2.删除数据
delete from 表名
where id not in (
select t.min_id from
(select min(id) as min_id
from shw.user_info
group by sfzhm,xm) as t);
思路:
1)根据sfzhm和xm进行分组;
2)取出分组后的最大id(或最小id);
3)删除除最大(或最小)id以外的其他字段;
not in 执行效率比较低,可以换成not exists,并且给表的id列建索引