mysql 高性能删除_【MySQL】删除重复记录保留一条的高性能DELETE写法

周中遇到一个情况就是一张表出现了很多重复记录,需要删除掉这些重复记录只保留一条,因为有自增长的主键,就决定保留PK最小的那一条吧。具体操作过程记录如下。

建一张示例表并插些数据看看吧。

mysql> CREATE TABLE `visitor_province_yn` (

->   `id` INT(11) NOT NULL AUTO_INCREMENT,

->   `visitor` int(10) unsigned NOT NULL,

->   `province` varchar(25) NOT NULL,

->   `yn` CHAR(1) NOT NULL,

->   PRIMARY KEY (`id`)

-> );

Query OK, 0 rows affected (0.01 sec)

mysql> INSERT INTO `visitor_province_yn`(`visitor`, `province`, `yn`) VALUES

-> (11, 'A省', 'Y'),

-> (11, 'A省', 'Y'),

-> (11, 'A省', 'Y'),

-> (22, 'B省', 'N'),

-> (22, 'B省', 'N'),

-> (22, 'B省', 'N'),

-> (33, 'C省', 'Y'),

-> (33, 'C省', 'Y'),

-> (33, 'C省', 'Y');

Query OK, 9 rows affected (0.00 sec)

Records: 9  Duplicates: 0  Warnings: 0

示例表“visitor_province_yn”表的数据如下,按照预想是删除重复保留“id”是1、4以及7这三条记录。

mysql> SELECT * FROM `visitor_province_yn`;

+----+---------+----------+----+

| id| visitor | province | yn |

+----+---------+----------+----+

| 1| 11| A省 | Y |

| 2| 11| A省 | Y |

| 3| 11| A省 | Y |

| 4| 22| B省 | N |

| 5| 22| B省 | N |

| 6| 22| B省 | N |

| 7| 33| C省 | Y |

| 8| 33| C省 | Y |

| 9| 33| C省 | Y |

+----+---------+----------+----+

9rows inset(0.00sec)

首先想到的是以下写法,因为DML和DQL是同一张表,不得不额外多一层嵌套子查询。所以,觉得这种写法简单明晰,但是性能应该要有所折扣。

DELETE FROM visitor_province_yn

WHERE id NOT IN(

SELECT id

FROM(

SELECT MIN(vpy.id) AS id

FROM visitor_province_yn AS vpy

GROUP BY vpy.visitor, vpy.province, vpy.yn

) AS tmp

);

于是,又去查询了一下MySQL官方手册有关“DELETE”语法的解释(http://dev.mysql.com/doc/refman/5.7/en/delete.html),结果一眼就找到了当前需要的另一种写法,在文档的“Multi-Table

Deletes”部分,形式如下。

DELETE t1 FROM t1 LEFT JOIN t2 ON t1.id=t2.id WHERE t2.id IS NULL;

以此为参考,改写后的SQL如下所示。

DELETE visitor_province_yn

FROM visitor_province_yn

LEFT JOIN(

SELECT MIN(vpy.id) AS id

FROM visitor_province_yn AS vpy

GROUP BY vpy.visitor, vpy.province, vpy.yn

) AS tmp USING (id)

WHERE tmp.id IS NULL;

因此,原来这种左连接返回存在于左表中而不存在于右表中记录的写法同样适用于“DELETE”。“EXPLAIN”一下发现,第二种写法以“PRIMARY”的查询方式代替第一种写法的“DEPENDENT SUBQUERY”,扫描更少的记录行,而且关联方式“type”是性能更优的“ref”(参考译文:http://blog..net/sweeper_freedoman/article/details/52819839)。由此可见,第二种写法更值得选择。



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
限时福利1:购课进答疑群专享柳峰(刘运强)老师答疑服务 为什么需要掌握高性能MySQL实战? 由于互联网产品用户量大、高并发请求场景多,因此对MySQL的性能、可用性、扩展性都提出了很高的要求。使用MySQL解决大量数据以及高并发请求已经是程序员的必备技能,也是衡量一个程序员能力和薪资的标准之一。 为了让大家快速系统了解高性能MySQL核心知识全貌,我为你总结了「高性能 MySQL 知识框架图」,帮你梳理学习重点,建议收藏! 【课程设计】 课程分为四大篇章,将为你建立完整的 MySQL 知识体系,同时将重点讲解 MySQL 底层运行原理、数据库的性能调优、高并发、海量业务处理、面试解析等。 一、性能优化篇: 主要包括经典 MySQL 问题剖析、索引底层原理和事务与锁机制。通过深入理解 MySQL 的索引结构 B+Tree ,学员能够从根本上弄懂为什么有些 SQL 走索引、有些不走索引,从而彻底掌握索引的使用和优化技巧,能够避开很多实战中遇到的“坑”。 二、MySQL 8.0新特性篇: 主要包括窗口函数和通用表表达式。企业中的许多报表统计需求,如果不采用窗口函数,用普通的 SQL 语句是很难实现的。 三、高性能架构篇: 主要包括主从复制和读写分离。在企业的生产环境中,很少采用单台MySQL节点的情况,因为一旦单个节点发生故障,整个系统都不可用,后果往往不堪设想,因此掌握高可用架构的实现是非常有必要的。 四、面试篇: 程序员获得工作的第一步,就是高效的准备面试,面试篇主要从知识点回顾总结的角度出发,结合程序员面试高频MySQL问题精讲精练,帮助程序员吊打面试官,获得心仪的工作机会。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值