一、防止出现重复数据
- 设置为主键(primary key)、唯一(unique)
- 插入数据时,采用insert ignore into而不是insert into
#insert ignore into会忽略数据库中已经存在的数据,如果数据库没有数据就插入新的数据,如果有数据的话就跳过这条数据
二、统计重复数据
#模板
select count(*) response, columns1 [,columns2]...
from table_name
group by columns1 [,columns2]...
having response>1;
columns表示可能包含重复值的列
三、过滤重复数据
-
distinct
select distinct columns1 [,columns2]… from table_name;
2 group byselect columns1 [,columns2]… from table_name
group by columns1;
四、删除重复数据
-
最笨蛋的方法:
先删除那条数据,然后再添加一条 -
通过分组
create table table_name2
select columns1 [,columns2] from table_name1
group by (columns1);drop table table_name1;
alter table table_name2 to table_name1;