有时候数据库会不可避免的导入重复的数据,我们就需要根据某些条件去确定哪些是重复的数据,然后把它删除。
创建如下表
<span style="font-size:18px;">CREATE TABLE `first_table` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`username` varchar(50) DEFAULT NULL,
`user_no` varchar(50) DEFAULT NULL,
`address` varchar(50) DEFAULT NULL,
`telphone` varchar(50) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=10 DEFAULT CHARSET=utf8;</span>
在这里面,名字,电话,地址一样的数据很多条,假设,我们想删除,名字和地址一样的员工
第一步:查找名字和地址一样的数据
select * from first_table group by username,address
第二步:把他们的id当作使用标记
select min(id) from first_table GROUP BY username,address;
第三步:删除id不在查询范围的。
delete from first_table where id not in (select min(id) from first_table GROUP BY username,address);
下面的句子看着很正确,但是运行的时候会报下面的错
[Err] 1093 - You can't specify target table 'first_table' for update in FROM clause;
大意就是,你不能一边查询,一边又删除,系统不支持你这么做,
这时候我们只需要一个小小的修改,给我们查询的数据起个别名
delete from first_table
where id not in (select * from (
select min(id) from first_table GROUP BY username,address
) as p
);
在查询表中数据