MySQL

做最专业的DBA

MySQL Help 答朋友问:5000W记录的Innodb表如何快速的去重复数据



朋友问: 
5000万数据的一张表,怎么去重快,根据两个字段判断是否重复。
  
  
回复之:
把2个字段以及主键id select 出来建立一张临时表t1,
t1建立好主键索引以及2个对比的字段联合索引。
  
然后在临时表里面 比对重复的记录,
把重复的记录录入第二张临时表t2,t2表结构和t1一模一样。
   
然后根据你的业务来决定如何处理t2表里面的重复记录,用t2关联原来的5000W记录的表来进行处理,
大概通常的是group by2个字段,取出主键id较大的值的记录删除掉。

阅读更多

扫码向博主提问

去开通我的Chat快问

mchdba

博客专家

非学,无以致疑;非问,无以广识
  • 擅长领域:
  • MySQL Hbas
  • Hbase
  • Tidb
  • cdb
  • 数据拆分
想对作者说点什么? 我来说一句

sql+如何重复数据

2008年07月20日 399B 下载

没有更多推荐了,返回首页

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭