关闭

一起做面试题--如何删除数据库表中的重复数据

875人阅读 评论(0) 收藏 举报
分类:

这个问题也经常考到,所以我就来说一下。

假设有这样的数据:


表名asshole,字段如上。

思路就是先确定重复记录的判断依据,这里的一句就是name,symptom,age三个字段都相同。所以先用group by语句查出相同name、symptom、age字段下的最小id是什么?必须确保有个自增字段或者能区分他们的字段,否则很难办了就,正常数据库表都有主键字段。

第一个SQL如下:

select min(id) from asshole group by name,symptom,age;

这个SQL查询出了以后三个字段分组,id最小的那个。

删除的话,就保留id最小的那个其他都删了就行了。

完整SQL如下

delete from asshole where not exists (select 1 from (select min(id) as min from asshole group by name,symptom,age) k where k.min=id);

就是把非分组后最小id的其他id记录都删掉。

1
1

猜你在找
【直播】机器学习&数据挖掘7周实训--韦玮
【套餐】系统集成项目管理工程师顺利通关--徐朋
【直播】3小时掌握Docker最佳实战-徐西宁
【套餐】机器学习系列套餐(算法+实战)--唐宇迪
【直播】计算机视觉原理及实战--屈教授
【套餐】微信订阅号+服务号Java版 v2.0--翟东平
【直播】机器学习之矩阵--黄博士
【套餐】微信订阅号+服务号Java版 v2.0--翟东平
【直播】机器学习之凸优化--马博士
【套餐】Javascript 设计模式实战--曾亮
查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:26767次
    • 积分:1272
    • 等级:
    • 排名:千里之外
    • 原创:105篇
    • 转载:0篇
    • 译文:0篇
    • 评论:7条
    文章分类
    最新评论