题目描述
删除emp_no重复的记录,只保留最小的id对应的记录。
CREATE TABLE IF NOT EXISTS titles_test (
id int(11) not null primary key,
emp_no int(11) NOT NULL,
title varchar(50) NOT NULL,
from_date date NOT NULL,
to_date date DEFAULT NULL);
insert into titles_test values ('1', '10001', 'Senior Engineer', '1986-06-26', '9999-01-01'),
('2', '10002', 'Staff', '1996-08-03', '9999-01-01'),
('3', '10003', 'Senior Engineer', '1995-12-03', '9999-01-01'),
('4', '10004', 'Senior Engineer', '1995-12-03', '9999-01-01'),
('5', '10001', 'Senior Engineer', '1986-06-26', '9999-01-01'),
('6', '10002', 'Staff', '1996-08-03', '9999-01-01'),
('7', '10003', 'Senior Engineer', '1995-12-03', '9999-01-01');
思路:
把数据按照 emp_no分组, 然后求每组的最小id 放到一个结果集, 扫描整个表, 把 id 不在上面结果集的都剔除掉。
第一种写法:
DELETE FROM titles_test
WHERE id NOT IN
(
SELECT MIN(id) FROM
(SELECT id, emp_no, title, from_date, to_date FROM titles_test ) AS tmp /*复制数据到tmp表*/
GROUP BY tmp.emp_no
);
在Mysql 本地测试 中, 上面如果不做一个tmp表来在tmp表找最小Id会报错。 ---- You can't specify target table 'titles_test' for update in FROM clause
就是如下第二种写法在mysql报错
第二种写法:
delete from titles_test
where id not in
(
select min(id) from titles_test group by emp_no
);
因为mysql认为你在更新表的时候又在查找表,当你在更新表的时候会锁表, 不能又查找表了。
但是第二种写法可以通过评测机。。
第一种写法只不过是复制一个表, 然后在复制表中进行查找操作, 在原表中进行更新操作, 更新和查询操作是在两个表中的!因此mysql中可以 成功执行。