mysql数据某字段重复。删除该记录；重复数据删除

最新推荐文章于 2024-04-17 15:25:46 发布

qunwuhui

最新推荐文章于 2024-04-17 15:25:46 发布

阅读量545

点赞数

分类专栏：数据库文章标签： mysql

本文链接：https://blog.csdn.net/qunwuhui/article/details/105981653

版权

数据库专栏收录该内容

7 篇文章 0 订阅

订阅专栏

mysql数据某字段重复。删除该记录

如：人员信息，身份证号重复，依据记录添加的时间，保留最新的，删除之前历史记录

方式1:只适用于数据量少的情况

1、查询重复数据并且按照添加时间正序排列

   SELECT
   t.id
FROM
   (
       SELECT
           t.id
       FROM
           t_user_info t
       ORDER BY
           t.add_time
       LIMIT 100000000 --保证分组时，能按照添加时间，获取之前的数据的id
   ) t
GROUP BY
   t.idno
HAVING --获得重复数据
   count(idno) > 1

2、删除历史数据

DELETE
FROM
   t_user_info
WHERE
   id IN (
       SELECT
           t.id
       FROM
           (
               SELECT
                   t.*
               FROM
                   t_user_info t
               ORDER BY
                   t.add_time
               LIMIT 100000000
           ) t
       GROUP BY
           t.idno
       HAVING
           count(idno) > 1 -- id 在重复的数据中
   )

方式二：数据量大的情况下（几百万至上千万），数据重复

方式1的语句中，先查询重复数据的id，再用in语句删除相应id的数据。数据量大的时候，无法执行；解决方式，将重复的数据存入临时表中，删除直接关联临时表进行处理。同理，大批量数据处理是也可以采用该方式。

1、创建临时表

CREATE TABLE `t_temp_member` (
`id` varchar(50) NOT NULL COMMENT '主键',
`source_id` varchar(100) DEFAULT NULL COMMENT '需要处理数据的id',
PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB DEFAULT CHARSET=utf8 ROW_FORMAT=DYNAMIC COMMENT='处理重复数据的临时表';

2、将需要删除的数据主键（或者是其他判断条件）存入临时表

INSERT INTO t_temp_member(id, source_id) (
SELECT
           t.id,t.source_id
       FROM
           (
               SELECT
                   t.id,t.source_id
               FROM
                   t_member_info t -- 待处理的数据表
               WHERE
                   t.delstatus = 0
               ORDER BY
                   t.mod_time -- 正序排序，将需要删除的数据保存至临时表中
               LIMIT 10000000000
           ) t
       GROUP BY
           t.source_id
       HAVING
           count(source_id) > 1)

3、关联查询删除数据

delete a.* from t_member_info a, t_temp_member b where a.id = b.id ;

qunwuhui

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
mysql数据某字段重复。删除该记录；重复数据删除

mysql数据某字段重复。删除该记录如：人员信息，身份证号重复，依据记录添加的时间，保留最新的，删除之前历史记录1、查询重复数据并且安装添加时间正序排列 SELECT t.idFROM ( SELECT t.id FROM t_user_info t ORDE...
复制链接

扫一扫