mysql 表归档_MySQL 5.6对大表做归档

本文介绍了在MySQL 5.6环境中,针对4000万行的大表进行历史数据归档的详细步骤。通过在主库创建历史表结构,从库复制并分批插入数据,使用Navicat导出SQL和DELETE语句,最后利用Python脚本执行脚本并删除主表历史数据,完成归档操作。整个过程旨在降低对业务的影响。
摘要由CSDN通过智能技术生成

环境:MySQL 5.6 主从环境(Keepalived架构)

4000W行大表进行历史数据归档。

方案:为尽量降低对业务影响,决定采取下列方案。

1、在主库建立

2016、2017、2018、2019的4个历史表结构。

2、在从库建立test库,并建立

2016、2017、2018、2019的4个历史表结构,在从库的主表上用insert into语句根据时间字段把数据插入test库的2016、2017、2018、2019的历史表里面。分拆为2016、2017、2018、2019。

3、用Navicat把

2016、2017、2018、2019导出为SQL文件,并生成主表的DELETE语句的TXT文件。

4、用Python脚本把

SQL文件和

TXT文件进行处理,分批导入到

2016、2017、2018、2019的4个历史表,并删除主表的历史数据。

5、对主表进行收缩。

完成归档。

1、在主库建立历史表的表结构。

CREATE TABLE `upload_order_header_2016` (

`id` bigint(22) NOT NULL AUTO_INCREMENT COMMENT '自增id',

`company` varchar(25) DEFAULT NULL COMMENT '货主',

PRIMARY KEY (`id`)

) ENGINE=InnoDB  DEFAULT CHARSET=utf8

2、从库建立test库,同样建立

历史表的表结构。

在从库上用insert into语句把2016年的历史数据插入test库的2016年的历史表。

insert into test.upload_order_header_2016 select * from log_db.upload_order_header

where add_time < unix_timestamp('2017-01-01  00:00:00');

insert into test.upload_order_header_2017 select * from log_db.upload_order_header

where add_time >= unix_timestamp('2017-01-01  00:00:00') and

add_time < unix_timestamp('2018-01-01  00:00:00');

3、用

Navicat把

2016导出为SQL文件,举例:

e97e5fbe842c826162cf7d0dad8468fb.png

96bfa8d344e965c6ea9ef0e8c35eaace.png

3582c61b5fd65b2dff3823f1314aff3e.png

8312406180e2a998165827c3c3a3a70f.png

c1977824fdd1c25061117cfe5dd1a50d.png

9c386e24f255bc3268cbc2c0a259cc02.png

a40e10d9c89ffa2562d39e8f1242ae63.png

导出的是纯insert的SQL脚本。

3fe57d6cf6dd29be9ebc9f0041b6b69b.png

导出Delete语句:

f096d39ac223e5197f0b80848da3ae90.png

d3d0f6a9bd2412e30a01cfabf26c5b44.png

d4f79aa22a341a2b5b60834615816cdc.png

d84cca80f28a4868d764bd82db3f4c60.png

bc68c9a9349d52b9df0fb8577d4df7bf.png

a038bdecec58ef22204869d7d3c4ea38.png

1d0eb4cbc6eb8411498d0b47af37e460.png

4、使用Python脚本批量运行上述脚本。

先insert到目标主库的历史表里,再delete目标主库的历史数据。

Python脚本如下:

load_sql_v1.py:

# coding:utf8

"""

1、更新数据库配置

2、变更待执行文件文件名为SQL.sql

3、执行文件

"""

import pymysql

import time

DB_IP = "192.168.22.10"

DB_USER = "DBA"

DB_PWD = "XXXXXX"

DB_DATABASE = "log_db"

WaitTime = 10

FilePath = [

'2016.sql',

]

for file in FilePath:

f = open(file, mode='r')

print(file)

content=f.readlines()

# 打开数据库连接

db = pymysql.connect(DB_IP, DB_USER, DB_PWD, DB_DATABASE, charset='utf8')

# 使用cursor()方法获取操作游标

cursor = db.cursor()

# 使用execute方法执行SQL语句

cursor.execute("SELECT VERSION()")

# 使用 fetchone() 方法获取一条数据

data = cursor.fetchone()

print("Database version : %s " % data)

for index, sql in enumerate(content):

if index % 10000 == 0:

print('已执行 %d'%index)

if index % 20000 == 0:

time.sleep(WaitTime)

try:

# 执行sql语句

db.ping(reconnect=True)

cursor.execute(sql)

# 提交到数据库执行

db.commit()

except Exception as e:

# Rollback in case there is any error

print(sql)

print(e)

##  db.rollback()

f.close()

# 关闭数据库连接

db.close()

5、对主表进行收缩。

用pt-osc工具做。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值