insert into select 主键自增_MySQL 自增ID 超大问题查询

击关注上方“SQL数据库开发”,

设为“置顶或星标”,第一时间送达干货

引言

小A正在balabala写代码呢,DBA小B突然发来了一条消息,“快看看你的用户特定信息表T,里面的主键,也就是自增id,都到16亿了,这才多久,在这样下去过不了多久主键就要超出范围了,插入就会失败,balabala......” 我记得没有这么多,最多1k多万,count了下,果然是1100万。原来运维是通过 auto_increment那个值看的,就是说,表中有大量的删除插入操作,但是我大部分情况都是更新的,怎么会这样?

问题排查

这张表是一个简单的接口服务在使用,每天大数据会统计一大批信息,然后推送给小A,小A将信息更新到数据库中,如果是新数据就插入,旧数据就更新之前的数据,对外接口就只有查询了。 很快,小A就排查了一遍自己的代码,没有删除的地方,也没有主动插入、更新id的地方,怎么会这样呢?难道是小B的原因,也不太可能,DBA那边儿管理很多表,有问题的话早爆出来了,但问题在我这里哪里也没头绪。 小A又仔细观察了这1000多万已有的数据,将插入时间、id作为主要观察字段,很快,发现了个问题,每天第一条插入的数据总是比前一天多1000多万,有时候递增的多,有时候递增的少,小A又将矛头指向了DBA小B,将问题又给小B描述了一遍。 小B问了小A,“你是是不是用了 REPLACE INTO...语句”,这是怎么回事呢,原来 REPLACE INTO...会对主键有影响。
“REPLACE INTO ...”对主键的影响
假设有一张表 t1:
CREATE TABLE `t1` (
`id`int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT 'ID,自增',
`uid` bigint(20) unsigned NOT NULL DEFAULT '0' COMMENT '用户uid',
`name` varchar(20) NOT NULL DEFAULT '' COMMENT '用户昵称',
PRIMARY KEY (`id`),
UNIQUE KEY `u_idx_uid` (`uid`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='测试replace into'
;

如果新建这张表,执行下面的语句,最后的数据记录如何呢?

insert into t1 values(NULL, 100, "test1"),
(NULL, 101, "test2");
replace into t1 values(NULL, 100, "test3");

6cb56b34210d0f144cbbceb893f6156c.png

原来, REPLACE INTO...每次插入的时候如果唯一索引对应的数据已经存在,会删除原数据,然后重新插入新的数据,这也就导致id会增大,但实际预期可能是更新那条数据。 小A说:“我知道replace是这样,所有既没有用它”,但还是又排查了一遍,确实不是自己的问题,没有使用 REPLACE INTO...。 小A又双叒叕仔细的排查了一遍,还是没发现问题,就让小B查下binlog日志,看看是不是有什么奇怪的地方,查了之后还是没发现问题,确实存在跳跃的情况,但并没有实质性的问题。 下图中 @1的值对应的是自增主键 id,用 (@2,@3)作为唯一索引:

31f29e62b49f134702fb77375c892ad8.png

后来过了很久,小B给小A指了个方向,小A开始怀疑自己的插入更新语句  INSERT...ON DUPLICATE KEY UPDATE...了,查了许久,果然是这里除了问题。
“INSERT ... ON DUPLICATE KEY UPDATE ...”对主键的影响
这个语句跟 REPLACE INTO...类似,不过他并不会变更该条记录的主键,还是上面 t1这张表,我们执行下面的语句,执行完结果是什么呢?
insert into t1 values(NULL, 100, "test4")
on duplicate key
update name = values(name);

d1699ffc5e11bf2dd55943a1e25abcbb.png

没错,跟小A预想的一样,主键并没有增加,而且 name字段已经更新为想要的了,但是执行结果有条提示,引起了小A的注意:
No errors; 2 rows affected, taking 10.7ms
明明更新了一条数据,为什么这里的影响记录条数是2呢?小A,又看了下目前表中的 auto_increment:

9fc856e9c6d276b08c36f10715fcb441.png

竟然是5`,这里本应该是4的。 也就是说,上面的语句,会跟 REPLACE INTO...类似的会将自增ID加1,但实际记录没有加,这是为什么呢? 查了资料之后,小A得知,原来,mysql主键自增有个参数 innodb_autoinc_lock_mode,他有三种可能只 0, 1, 2,mysql5.1之后加入的,默认值是 1,之前的版本可以看做都是 0。 可以使用下面的语句看当前是哪种模式:
  1. select @@innodb_autoinc_lock_mode;

小A使用的数据库默认值也是1,当做简单插入(可以确定插入行数)的时候,直接将auto_increment加1,而不会去锁表,这也就提高了性能。 当插入的语句类似insert into select ...这种复杂语句的时候,提前不知道插入的行数,这个时候就要要锁表(一个名为AUTO_INC的特殊表锁)了,这样auto_increment才是准确的,等待语句结束的时候才释放锁。 还有一种称为Mixed-mode inserts的插入,比如INSERT INTO t1 (c1,c2) VALUES (1,'a'), (NULL,'b'), (5,'c'), (NULL,'d'),其中一部分明确指定了自增主键值,一部分未指定,还有我们这里讨论的INSERT ... ON DUPLICATE KEY UPDATE ...也属于这种. 这个时候会分析语句,然后按尽可能多的情况去分配auto_incrementid,这个要怎么理解呢,我看下面这个例子:
  1. truncate table t1;

  2. insert into t1

  3. values

  4. (NULL, 100, "test1"),

  5. (NULL, 101, "test2"),

  6. (NULL, 102, "test2"),

  7. (NULL, 103, "test2"),

  8. (NULL, 104, "test2"),

  9. (NULL, 105, "test2");

此时数据表下一个自增id是7:

  1. deletefrom t1

  2. where id in (2,3,4);

此时数据表只剩1,5,6了,自增id还是7:

  1. insert into t1

  2. values

  3. (2, 106, "test1"),

  4. (NULL, 107, "test2"),

  5. (3, 108, "test2");

这里的自增id是多少呢? 上面的例子执行完之后表的下一个自增id是10,你理解对了吗,因为最后一条执行的是一个 Mixed-mode inserts语句,innoDB会分析语句,然后分配三个id,此时下一个id就是10了,但分配的三个id并不一定都使用。此处* @总是迟到[zongshichidao] * 多谢指出,看官方文档理解错了。 模式 0的话就是不管什么情况都是加上表锁,等语句执行完成的时候在释放,如果真的添加了记录,将 auto_increment加1。 至于模式 2,什么情况都不加 AUTO_INC锁,存在安全问题,当 binlog格式设置为 Statement模式的时候,从库同步的时候,执行结果可能跟主库不一致,问题很大。因为可能有一个复杂插入,还在执行呢,另外一个插入就来了,恢复的时候是一条条来执行的,就不能重现这种并发问题,导致记录id可能对不上。 至此,id跳跃的问题算是分析完了,由于 innodb_autoinc_lock_mode值是1, INSERT...ON DUPLICATE KEY UPDATE...是简单的语句,预先就可以计算出影响的行数,所以不管是否更新,这里都将 auto_increment加1(多行的话大于1)。 如果将 innodb_autoinc_lock_mode值改为 0,再次执行 INSERT...ON DUPLICATE KEY UPDATE...的话,你会发现 auto_increment并没有增加,因为这种模式直接加了 AUTO_INC锁,执行完语句的时候释放,发现没有增加行数的话,不会增加自增id的。
“INSERT ... ON DUPLICATE KEY UPDATE ...”影响的行数是1为什么返回2?
为什么会这样呢,按理说影响行数就是1啊,看看官方文档的说明:
With ON DUPLICATE KEY UPDATE, the affected-rows value per row is 1 if the row is inserted as a new row, 2 if an existing row is updated, and 0 if an existing row is set to its current values
官方明确说明了,插入影响1行,更新影响2行,0的话就是存在且更新前后值一样。是不是很不好理解? 其实,你要这样想就好了,这是为了区分到底是插入了还是更新了,返回1表示插入成功,2表示更新成功。

解决方案

将 innodb_autoinc_lock_mode设置为0肯定可以解决问题,但这样的话,插入的并发性可能会受很大影响,因此小A自己想着DBA也不会同意。经过考虑,目前准备了两种较为可能的解决方案:
修改业务逻辑
修改业务逻辑,将 INSERT...ON DUPLICATE KEY UPDATE...语句拆开,先去查询,然后去更新,这样就可以保证主键不会不受控制的增大,但增加了复杂性,原来的一次请求可能变为两次,先查询有没有,然后去更新。
删除表的自增主键
删除自增主键,让唯一索引来做主键,这样子基本不用做什么变动,只要确定目前的自增主键没有实际的用处即可,这样的话,插入删除的时候可能会影响效率,但对于查询多的情况来说,小A比较两种之后更愿意选择后者。

结语

其实 INSERT...ON DUPLICATE KEY UPDATE...这个影响行数是2的,小A很早就发现了,只是没有保持好奇心,不以为然罢了,没有深究其中的问题,这深究就起来会带出来一大串新知识,挺好,看来小A还是要对外界保持好奇心,保持敏感,这样才会有进步。

作者:燕南飞Liam

来自:https://segmentfault.com/a/1190000017268633

——End——

后台回复关键字:1024,获取一份精心整理的技术干货

后台回复关键字:进群,带你进入高手如云的交流群。

推荐阅读

  • 昨天大半个科技圈都在吃瓜!腾讯回应:一言难尽,1000瓶老干妈求骗子线索
  • 我只会SQL,到底能不能找到好工作呢?
  • Oracle常用函数整理
  • MySQL常用函数整理
  • 干掉Navicat,这个数据库管理工具真香!
这是一个能学到技术的公众号,欢迎关注 7e4804d24fbfdd92ff640c776a563277.png 点击「 」了解SQL训练营
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 在使用MySQL和MyBatis时,如果需要通过INSERT INTO SELECT语句实现数据的插入,并且需要保持自增主键的连续性,可以采用如下步骤: 1.创建一个空表,表结构和要插入的数据的表结构一致,但不包含自增主键列。 2.通过MyBatis查询要插入的数据,在查询语句中指定自增主键列的为NULL。 3.将查询结果插入到空表中,这时MySQL会自动为每行数据生成自增主键。 4.将插入完成的数据重新插入到要插入的数据的表中,这时MySQL会将之前生成的自增主键复制到目标表中的自增主键列中。 需要注意的是,如果在目标表中存在其他唯一索引,需要在插入之前将这些唯一索引去除,以避免插入数据时出现唯一索引冲突的错误。 ### 回答2: 在MySQL和MyBatis中同时使用INSERT INTO SELECT语句并设置自增主键,需要注意一些细节问题。以下是一些经验和建议: 1. 在MySQL中,如果要为自增主键赋初始,可以使用以下语句: ALTER TABLE 表名 AUTO_INCREMENT = 初始; 这个初始应该是大于目前表中任何自增主键,否则会发生冲突导致插入失败。 2. 在INSERT INTO SELECT语句中,要指定要插入的列名,并将自增主键id排除在外,如下所示: INSERT INTO 目标表 (列1, 列2, 列3, ...) SELECT 列1, 列2, 列3, ... FROM 源表; 如果源表中也有自增主键id列,则也需要在SELECT语句中排除在外。 3. 在MyBatis的mapper.xml文件中,使用<selectKey>标签来配置自增主键回填的方式。下面是一个例子: <!-- 新增用户,并返回自增ID --> <insert id="addUser" parameterType="User"> <!-- 指定需要插入的列,排除自增ID --> INSERT INTO t_user (name, age, gender) VALUES (#{name}, #{age}, #{gender}) <!-- 指定自增主键字段和回填方式 --> <selectKey resultType="java.lang.Long" keyProperty="id" order="AFTER"> SELECT LAST_INSERT_ID(); </selectKey> </insert> 这个代码片段中,<selectKey>标签中的keyProperty属性指定了要回填的属性名,resultType指定了回填的类型,order属性指定了回填的时机。 4. 在Java代码中,插入操作完成后,可以通过调用get方法获取自增主键。例如: Long id = user.getId(); // getId()是User类中自增主键属性id的getter方法 总之,MySQL和MyBatis中INSERT INTO SELECT自增主键的处理需要注意细节,特别是回填自增主键。遵循上述经验和建议可以确保插入操作的正确性和可靠性。 ### 回答3: 在MySQL中,自增主键通常用于确保每个记录都具有唯一标识符。当使用INSERT INTO SELECT语句在表之间移动数据时,自增主键可以帮助确保插入的新记录也具有唯一的标识符。在MyBatis中使用INSERT INTO SELECT语句进行数据迁移操作时,也可以设置自增主键。 在MySQL中,可以使用AUTO_INCREMENT关字来为一个列设置自增主键。例如,如果要在名为table1的表中创建一个自增主键id,则可以使用以下SQL语句: CREATE TABLE table1 ( id INT AUTO_INCREMENT PRIMARY KEY, col1 VARCHAR(255), col2 INT ); 这将在表中创建一个名为id的列,并将其作为主键,使用AUTO_INCREMENT关字使其成为自增列。 在MyBatis中使用INSERT INTO SELECT语句插入数据时,要确保自增主键正确地设置。可以使用以下方法来确保自增主键正确: 1.在INSERT INTO SELECT语句中指定要插入的列以及它们的。这将包括不包括自增主键。 2.使用LAST_INSERT_ID()函数来获取最近插入记录的自增主键。 3.将获取到的自增主键设置到要插入的记录中。 以下是一个在MyBatis中使用INSERT INTO SELECT语句插入数据,并设置自增主键的示例代码: <insert id="insertData" parameterType="your.package.Table1"> <selectKey keyProperty="id" order="AFTER" resultType="java.lang.Integer"> SELECT LAST_INSERT_ID() </selectKey> INSERT INTO table1 (col1, col2) SELECT #{col1}, #{col2} FROM table2 WHERE id = #{id} </insert> 在上面的代码中,使用<selectKey>标签来获取最近插入记录的自增主键,并将其赋id属性。在INSERT INTO SELECT语句中省略了id列,因为MySQL会自动生成自增主键。 总之,MySQL中的自增主键可以确保每个记录都具有唯一标识符,而在MyBatis中使用INSERT INTO SELECT语句进行数据迁移操作时,也可以设置自增主键。可以使用LAST_INSERT_ID()函数来获取最近插入记录的自增主键,并将其赋给要插入的记录,以确保自增主键正确。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值