MySql数据库去除重复的数据

今天群内有群友提出了一个问题,就是MySql中删除重复数据的问题,然后回答了一下,发现正好接触到了之前可能没关注的一点儿小知识,在此做下简要记录(哦对,昨天晚上在试用腾讯云数据库的时候还遇到一个问题,就是腾讯云数据库的Mysql对大小写是敏感的)。

OK,接下来我们进入正题,首先我按照群友的数据结构创建了一张表,填充了一部分数据,结构如下图所示:


那么我们首先来确定我们删除数据的时候的所需条件,首先找到所有重复的数据记录,使用如下sql语句进行

select * from a group by cardno having count(cardno) > 1
查询结果如下:

查询出来的是所有重复数据的第一条记录,但是这个是我们需要保留的,所以条件变成了,(改用如下的sql语句查询,根据cardno查询)重复数据中不包含本条记录的结果删除:

下午写的时候犯了个错误,这里已经更正

 查询语句如下:

select id,cardno from a where cardno in (select cardno from a group by cardno having count(cardno)>1)
and id not in(select min(id) from a group by cardno having count(cardno)>1)

这些记录是我们需要删除的,OK,接下来我们就直接删除掉这些数据就OK了,我们根据id主键来删除,sql语句如下:

delete from a where id in(select id from a where cardno in (select cardno from a group by cardno having count(cardno)>1)
and id not in(select min(id) from a group by cardno having count(cardno)>1))
执行结果如下:


Oops!报错了,这条提示信息说的是,诶同学,在MySql里你不能先查询了然后再删除诶!哦,好吧,这个就只能等官方升级支持这个新特性了,但是我们现在就要解决这个棘手的问题啊,肿么办?我们用临时表来解决,然后我们的删除语句变成了,这个样子:

delete from a where id in (select id from (select id from a where cardno in (select cardno from a group by cardno having count(cardno)>1)
and id not in(select min(id) from a group by cardno having count(cardno)>1)) as tmpresult)

执行,OK,可以看到我们上面查询的出来要删除的6条重复数据已经被清理掉了,结果如下:


OK,那么群里的那位朋友的问题是,他只想删除固定的卡号的话该怎么办呢?

这个就相当于附加的条件筛选了,我们直接在临时表的查询里附加条件:(注:红色加粗字体是附加条件)

delete from a where id in (select id from (select id from a where cardno in (select cardno from a group by cardno having count(cardno)>1 <strong>and cardno=333</strong>)
and id not in(select min(id) from a group by cardno having count(cardno)>1)) as tmpresult)


这样儿就完成了Mysql删除重复数据的需求。

But,该语句尚未做系能测试,而且我这小菜儿暂时也没有时间去做这个相关的工作了,留待以后抽时间专门研究下MySql的性能,同时如果大家有更好的方式不妨直接在下方留下评论,我们共同探讨。


2014年10月12日23:40:58,EricTang记。





  • 5
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 8
    评论
MySQL数据库是一种常用的关系型数据库管理系统,可以用于存储和管理大量的结构化数据。在进行数据清洗时,可以通过以下步骤来开展: 1. 数据导入:将需要清洗的数据导入到MySQL数据库中。可以使用MySQL提供的命令行工具或者可视化工具(如Navicat、MySQL Workbench等)来导入数据。 2. 数据预览与分析:在导入数据后,可以使用SQL语句查询数据,对数据进行预览和分析。通过观察数据的结构和内容,可以初步了解数据的问题和需要清洗的方向。 3. 数据清洗规则定义:根据数据的问题和需求,定义相应的数据清洗规则。例如,去除重复数据、处理缺失值、修正错误数据等。 4. 编写清洗脚本:根据定义的清洗规则,编写SQL语句或存储过程来实现数据清洗操作。可以使用UPDATE语句、DELETE语句等来修改或删除不符合规则的数据。 5. 执行清洗脚本:将编写好的清洗脚本在MySQL数据库中执行,对数据进行清洗操作。可以使用命令行工具或可视化工具执行SQL语句或调用存储过程。 6. 数据验证与测试:在执行清洗脚本后,需要对清洗后的数据进行验证和测试,确保数据的准确性和完整性。可以使用SQL语句查询清洗后的数据,并进行比对和统计分析。 7. 数据导出与保存:清洗完成后,可以将清洗后的数据导出为新的数据文件或保存到新的表中,以备后续使用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值