【MySQL】大数据表里面插入字段的操作

最近在面试找工作的时候遇到一些之前没有思考或者接触过的问题,其中一大块是MySQL的相关知识点以及一些实战中遇到的问题
题目:
向一个3000w条数据的表里面新增一个字段,需要如何操作?

分析:
咋一听这个问题,感觉好像完全没有头绪,如果没有提前准备的话,可能真的比较懵。按照知识库的储备应该是直接写sql:alter table xxx add column [column_name] type comment ‘…’;这样就可以了

但是实际上对于大批量的数据直接使用这种做法的话,很容易卡死,因为数据量过大导致的MySQL处理能力上的不足会对于数据库的响应造成一定的影响,同时可能会导致数据库的不可用,然后造成一系列的多米诺骨牌效应。

解决方案:

思路一

那么正确的插入姿势是什么样的呢?
在这里其实我们可以想到的一种方案是新建一个空表,在新建的表里面里面插入字段,然后把旧表里面的输入插入到这个空表里面来,等数据迁移完成这之后,再更改表名即可。
下面是具体的步骤:

  1. 新建一个临时表,假设表名为user_info_temp, 之前的表名为:
> create table user_info_temp like user_info;

2.向新的表里面加入我们要加的字段

alter table user_info_temp add column hobby varchar(32) default null comment "爱好";
  1. 把旧表的数据插入到新表种

insert into user_info_temp(uid,username,pwd,createtime,updatetime) select uid,username,pwd,createtime,updatetime from user_info;

4.对表进行重命名。

rename table user_info to user_info_bak;
rename table user_info_temp to user_info;

但是实际操作中,会出现卡死的现象,经过仔细分析,我们会发现,新的表除了拷贝了之前表的字段,同时也获取了原表里面的主键和索引,我们知道在有索引和主键的情况下,数据在写入的时候除了写入字段的值以为还会在磁盘上额外写入字段的索引信息,对于3000w条数据,这一项工作同样是一笔巨大的开销,所以就出现了卡死的现象,那么如何改进呢?

方案二:

方案二,我们在方案一的基础上删除主键和索引先,所以实现的顺序如下。

  1. 新建临时表
    create table user_info_temp like user_info;

2.删除之前的索引和主键

alter table user_info_temp drop PRIMARY KEY;
alter talbe user_info_temp drop index index_name; // 注意修改这里的索引名称

3.新增新的字段

alter table user_info_temp add column hobby varchar(32) default null comment "爱好"; 

4.向新表迁入数据

insert into table user_info_temp(uid,username,pwd,createtime,updatetime) select  uid,username,pwd,createtime,updatetime from user_info;

5.向新表里面添加对应的主键和索引

alter table user_info_temp add PRIMARY KEY(uid); //这里的uid换成你们自己的字段
alter table user_info_temp add index index_name(column1,column2); //这里你们懂的,index_name,column1,column2 换成你们自己的

6.重命名

rename table user_info to user_info_bak;
rename table user_info_temp to user_info;

在新的方案里面,因为我们先去掉了主键和索引,所以在迁移数据的时候,大大减少了磁盘IO的次数,方案改进之后,从开始到迁移3100万数据卡死,执行了3个小时左右。第二次执行,删除主键和索引,执行insert into … select …语句,全部数据迁移只用了半小时。数据迁移后再把主键和索引加上,添加主键用了20分钟,添加5个索引的耗时都在10分钟以下,一个多小时完成整张表的迁移工作。

你以为这就完了吗?
在实际应用中,我们不需要考虑是否停服的问题吗?
如果是停服更新的话,新旧表数据就一定是一致的,但是也有一些情况是不停服更新的,那么我们就需要关注在迁移的过程中,user_info里面新增或者更新的数据,这又需要分开来看:对于新增的数据批量写入到新的表里面,但是注意不要带上主键id写入,因为新的user_info表可能也写入了新的数据,你直接带上主键id插入到新的user_info表,必然出现主键冲突的现象。
对于更新的数据,我们可以根据表里面的update_time时间来查找哪些是在
我们迁移的过程中发生了变更的数据,然后批量更新到新的user_info表即可。

今天的内容就是这些了,感谢您的阅读!_

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
当需要在大数据量的MySQL中添加字段时,一般采取以下步骤: 1. 首先,确认新字段的数据类型和长度。需要考虑新字段所存储的数据类型和取值范围,选择合适的数据类型,以及确定字段的长度,以确保数据的准确性和完整性。 2. 在确认新字段的数据类型和长度后,可以使用ALTER TABLE语句来添加新字段。ALTER TABLE语句用于修改的结构,包括添加字段、删除字段、修改字段等。语法如下: `ALTER TABLE 名 ADD 列名 数据类型 [约束条件] [FIRST | AFTER 上一个字段];` 其中,名为要进行修改的名称,列名为新字段的名称,数据类型为新字段的数据类型,约束条件为字段的约束条件,如NOT NULL,UNIQUE等。FIRST和AFTER用于确定新字段的位置,可以是第一个字段或者在某个已有字段后进行插入。 3. 执行ALTER TABLE语句后,MySQL将执行的结构变更操作,添加新字段中。在数据量较大的情况下,这个过程可能需要一定时间,取决于服务器的性能和数据量的大小。 4. 在添加新字段后,需要考虑对该字段进行相应的操作,如插入默认值、更新现有数据等。可以使用UPDATE语句批量更新现有数据,以确保新字段的数据和已存在的数据保持一致。 需要注意的是,在进行结构变更操作时,建议先备份数据,以避免意外情况造成数据丢失或损坏。另外,在大数据上进行结构变更操作时,建议在低峰期进行,以减少对系统性能的影响。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值