删除数据库中的重复记录(仅删除重复的)

背景:

今天在用crawler爬数据的时候,第一次爬的时候被我意外中止了,后来又重新开始,但却忘了清除一些垃圾数据,导致在wordlocation 表中产生了不少重复的记录。

wordlocation 表的定义如下 wordlocation(urlid, wordid, location),其中(urlid, wordid) 应该是唯一的。

要求:

从wordlocation 表中删除多余的重复数据

方案:

创建一个结构一模一样的表wl_new,然后执行下面的语句

    INSERT INTO wl_new SELECT * FROM wordlocation GROUP BY urlid, wordid

最后的GROUP BY 保证了(urlid, wordid)的唯一性

然后再删除wordlocation表中的所有数据,把wl_new的所有数据插入到wordlocation,最后删除wl_new即可     

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值