在实际中,经常遇见重复插入数据的情况,一般的方法就是在server端先select做了判断后再insert,这中方法在效率和数据一致性上都是有问题的。实际上mysql的insert 语法给我们提供了一些支持了的
INSERT语法
一、使用replace代替
replace和insert使用方法一致,只是效果不同,如果replace执行的时候发现有相同的唯一键,那么就会先删除以前的那一行,然后在重新插入一行数据,这个时候有一个危险就是,如果有多个唯一键,可能会删除多行数据
二、IGNORE
IGNORE是mysql相对于标准SQL的扩展。如果在新表中有重复关键字,
或者当STRICT模式启动后出现警告,则使用IGNORE控制ALTER TABLE的运行。
如果没有指定IGNORE,当重复关键字错误发生时,插入操作被放弃,返回前一步骤。
如果指定了IGNORE,则对于有重复关键字的行,只使用第一行,其它有冲突的行被删除。
并且,对错误值进行修正,使之尽量接近正确值。
insert ignore into tb(...) value(...)
这样不用校验是否存在了,有则忽略,无则添加
三、ON DUPLICATE KEY UPDATE
如果您指定了ON DUPLICATE KEY UPDATE,并且插入行后会导致在一个UNIQUE索引或PRIMARY KEY中出现重复值,则执行旧行UPDATE。例如,如果列a被定义为UNIQUE,并且包含值1,则以下两个语句具有相同的效果:
mysql> INSERT INTO table (a,b,c) VALUES (1,2,3) ON DUPLICATE KEY UPDATE c=c+1;
mysql> UPDATE table SET c=c+1 WHERE a=1;
如果行作为新记录被插入,则受影响行的值为1;如果原有的记录被更新,则受影响行的值为2。
注释:如果列b也是唯一列,则INSERT与此UPDATE语句相当:
mysql> UPDATE table SET c=c+1 WHERE a=1 OR b=2 LIMIT 1;
如果a=1 OR b=2与多个行向匹配,则只有一个行被更新。通常,您应该尽量避免对带有多个唯一关键字的表使用ON DUPLICATE KEY子句。
您可以在UPDATE子句中使用VALUES(col_name)函数从INSERT...UPDATE语句的INSERT部分引用列值。换句话说,如果没有发生重复关键字冲突,则UPDATE子句中的VALUES(col_name)可以引用被插入的col_name的值。本函数特别适用于多行插入。VALUES()函数只在INSERT...UPDATE语句中有意义,其它时候会返回NULL。
示例:
mysql> INSERT INTO table (a,b,c) VALUES (1,2,3),(4,5,6) ON DUPLICATE KEY UPDATE c=VALUES(a)+VALUES(b);
本语句与以下两个语句作用相同:
mysql> INSERT INTO table (a,b,c) VALUES (4,5,6) ON DUPLICATE KEY UPDATE c=9;
当您使用ON DUPLICATE KEY UPDATE时,DELAYED选项被忽略。
四、insert **select语句
当然,还可以使用一些比较麻烦的insert select语句来达到一个sql语句执行插入的操作:
insert into friend(userId,friendId,friendRemark) select 1,2,"abc" from (select id,friendId,userId,friendRemark where userId= 1,friendId=2 limit 1 ) b where b.id is null
总结 :
1. DELAYED 做为快速插入,并不是很关心失效性,提高插入性能。
2. Ignore 只关注主键对应记录是不存在,无则添加,有则忽略。
3. ON DUPLICATE KEY UPDATE 在添加时操作,关注非主键列,注意与ignore的区别,有则更新指定列,无则添加。