MySQL数据库归档脚本

归档数据库(带时间年限)

#!/bin/bash

##############################变量修改定义区################################

# 需要改表名,默认源和归档表是一致的
SOURCE_TABLE="表名"
BACKUP_TABLE="表名"

# 归档年限(用于获取归档日期的最大值和最小值)
ARCHIVE_TIME_LIMIT='DATE_SUB(CURDATE(), INTERVAL 1 YEAR )'

# 需要修改时间字段名
DATE_FIELD="时间字段名"

# ID字段或唯一字段(防止出现重复时间无法取值问题,如果不存在时间重复问题,可不设置,不设置默认使用DATE_FIELD变量)
ID_FIELD="ID字段或唯一字段"

if [ -z "$ID_FIELD" ];then
	FIELD_NAME=$DATE_FIELD
else
	FIELD_NAME=$ID_FIELD
fi

echo "FIELD_NAME参数为:$FIELD_NAME"
#############################以下是数据库连接###############################

# 归档目的MySQL数据库连接信息
DB_HOST="数据库连接地址 "
DB_USER="用户名"
DB_PASS="密码"
DB_NAME="库名"
PORT="端口"

# 归档源MySQL数据库连接信息
DB_HOST1="数据库连接地址"
DB_USER1="用户名"
DB_PASS1="密码"
DB_NAME1="库名"
PORT1="端口"

################################变量定义结束################################

#获取当天日期
TODAY_DATE=$(date +%Y-%m-%d)

#获取最近的一次数据时间,用于截止时间
TBL_NEW_TIME=$(mysql -h $DB_HOST1 -u $DB_USER1 -p$DB_PASS1 -P$PORT1 -D $DB_NAME1 -se "SELECT $DATE_FIELD FROM $DB_NAME1.$SOURCE_TABLE order by $DATE_FIELD DESC limit 1")

#获取当前表的总行数
START_TBL_TOTAL_LINE=$(mysql -h $DB_HOST1 -u $DB_USER1 -p$DB_PASS1 -P$PORT1 -D $DB_NAME1 -se "SELECT count(*) FROM $DB_NAME1.$SOURCE_TABLE where $DATE_FIELD <= '$TBL_NEW_TIME'")


# 获取创建时间字段的最大值和最小值(抓取指定字段当前日期的几年前之前的记录,并获取日期的最大和最小值)
MIN_DATE=$(mysql -h $DB_HOST1 -u $DB_USER1 -p$DB_PASS1 -P$PORT1 -D $DB_NAME1 -se "SELECT MIN($DATE_FIELD) FROM $DB_NAME1.$SOURCE_TABLE where $DATE_FIELD < $ARCHIVE_TIME_LIMIT")
MAX_DATE=$(mysql -h $DB_HOST1 -u $DB_USER1 -p$DB_PASS1 -P$PORT1 -D $DB_NAME1 -se "SELECT MAX($DATE_FIELD) FROM $DB_NAME1.$SOURCE_TABLE where $DATE_FIELD < $ARCHIVE_TIME_LIMIT")

#echo $MIN_DATE1
#echo $MAX_DATE1

#MIN_DATE=$(date -d "$MIN_DATE1" +%Y-%m-%d %H:%M:%S)
#MAX_DATE=$(date -d "$MAX_DATE1" +%Y-%m-%d %H:%M:%S)

echo $MIN_DATE
echo $MAX_DATE

# 将最小日期转换为日期格式
CURRENT_DATE=$(date -d "$MIN_DATE" +%Y-%m-%d)

# 循环操作,每次插入十万行数据到备份表
BATCH_SIZE=100000
OFFSET=0

while [[ "$CURRENT_DATE" < "$MAX_DATE" ]]; do
  NEXT_DATE=$(date -d "$CURRENT_DATE +1 days" +%Y-%m-%d)

  while true; do
    mysql -h $DB_HOST -u $DB_USER -p$DB_PASS -P$PORT -D $DB_NAME -e "
      INSERT INTO $BACKUP_TABLE
      SELECT * FROM jdbc_catalog.$DB_NAME1.$SOURCE_TABLE
      WHERE $DATE_FIELD >= '$CURRENT_DATE' AND $DATE_FIELD < '$NEXT_DATE'
      AND $DATE_FIELD >= '$MIN_DATE' AND $DATE_FIELD <= '$MAX_DATE'
      LIMIT $BATCH_SIZE OFFSET $OFFSET;
    "

    OFFSET=$((OFFSET + BATCH_SIZE))
  done

  # 更新日期和偏移量
  CURRENT_DATE=$NEXT_DATE
  OFFSET=0
done

echo "数据插入完成。"

#获取创建时间字段目的归档库总数和以及源库总数

SO_COUNT=$(mysql -h $DB_HOST -u $DB_USER -p$DB_PASS -P$PORT -D $DB_NAME -se "SELECT count(1) FROM $DB_NAME.$BACKUP_TABLE where $DATE_FIELD >= '$MIN_DATE' and $DATE_FIELD <= '$MAX_DATE' ")
DE_COUNT=$(mysql -h $DB_HOST1 -u $DB_USER1 -p$DB_PASS1 -P$PORT1 -D $DB_NAME1 -se "SELECT count(1) FROM $DB_NAME1.$SOURCE_TABLE where $DATE_FIELD >= '$MIN_DATE' and $DATE_FIELD <= '$MAX_DATE' ")


echo "Count from SO_COUNT: $SO_COUNT"
echo "Count from DE_COUNT: $DE_COUNT"

#对比归档的数据总量是否一致

if [ "$SO_COUNT" -eq "$DE_COUNT" ]; then
    echo "归档数据总行数对比一致"
else
    echo "【ERROR】归档数据总行数对比不一致"
    exit 1
fi

#随机获取创建时间字段的归档里面的一条数据和以及源库里面的一条数据


DATA_DATE1=$(date -d "$MAX_DATE" +%Y-%m-%d)
DATA_DATE2=$(date -d "$DATA_DATE1 -90 days" +%Y-%m-%d)

sr_data=$(mysql -h $DB_HOST -u $DB_USER -p$DB_PASS -P$PORT -D $DB_NAME -se "SELECT * FROM $DB_NAME.$BACKUP_TABLE where $DATE_FIELD < '$DATA_DATE1' and $DATE_FIELD >= '$DATA_DATE2' order by $FIELD_NAME DESC LIMIT 1 OFFSET 9")
tx_data=$(mysql -h $DB_HOST1 -u $DB_USER1 -p$DB_PASS1 -P$PORT1 -D $DB_NAME1 -se "SELECT * FROM $DB_NAME1.$SOURCE_TABLE where $DATE_FIELD < '$DATA_DATE1' and $DATE_FIELD >= '$DATA_DATE2' order by $FIELD_NAME DESC LIMIT 1 OFFSET 9")

echo "随机获取数据的最大时间范围为$DATA_DATE1"
echo "随机获取数据的最小时间范围为$DATA_DATE2"

# 判断两个变量是否为空  
if [ -z "$sr_data" ] || [ -z "$tx_data" ]; then  
    echo "【ERROR】获取第10行源数据/归档数据时,发现数据为空" && exit 1  
else  
    echo "获取第10行归档数据为:$sr_data"  
    echo "获取第10行源数据为:$tx_data"  
fi

MD5_1=$(echo -n "$sr_data" | md5sum | awk '{print $1}')
MD5_2=$(echo -n "$tx_data" | md5sum | awk '{print $1}')


echo "MD5 of data from sr_data: $MD5_1"
echo "MD5 of data from tx_data: $MD5_2"

#对比归档的数据其中一条数据的MD5是否一致

if [ "$MD5_1" == "$MD5_2" ]; then
    echo "数据MD5码对比一致"
else
    echo "【ERROR】数据MD5码对比不一致"
	exit 1
fi

#备份归档数据到本地文本

if mysqldump -h$DB_HOST1 -P$PORT1 -u$DB_USER1 -p$DB_PASS1 --databases $DB_NAME1 --tables $SOURCE_TABLE --where="$DATE_FIELD >= '$MIN_DATE' and $DATE_FIELD <= '$MAX_DATE'" --skip-add-drop-table --no-create-info --complete-insert > /home/archived_data/$SOURCE_TABLE-$TODAY_DATE.sql;then
#删除数据并备份数
	mysql -h $DB_HOST1 -u $DB_USER1 -p$DB_PASS1 -P$PORT1 -D $DB_NAME1 -se "DELETE FROM  $DB_NAME1.$SOURCE_TABLE where $DATE_FIELD >= '$MIN_DATE' and $DATE_FIELD <= '$MAX_DATE'"
else
	exit 1
fi

#归档后行数校验
#获取归档后行数,范围加上截止时间变量,防止数据新增导致行数不一致
END_TBL_TOTAL_LINE=$(mysql -h $DB_HOST1 -u $DB_USER1 -p$DB_PASS1 -P$PORT1 -D $DB_NAME1 -se "SELECT count(*) FROM $DB_NAME1.$SOURCE_TABLE where $DATE_FIELD <= '$TBL_NEW_TIME'")
if [ -z "$END_TBL_TOTAL_LINE" ];then
	echo "【ERROR】获取归档后行数失败!" && exit 1
else
	echo "归档后数据行数为:$END_TBL_TOTAL_LINE"
fi


# 计算差值
DIFFERENCE=$((START_TBL_TOTAL_LINE - END_TBL_TOTAL_LINE))

#校验行数生产库运行前行数-生产库归档后行数=已归档行数
if [ "$DIFFERENCE" -eq "$SO_COUNT" ];then
	echo "校验正常,$TODAY_DATE已归档数据与生产库差值数据相同"
else
	echo "【ERROR】校验异常,$TODAY_DATE已归档数据与生产库差值不相等,生产库差值行数为:$DIFFERENCE,已归档数据行数为:$SO_COUNT"
	exit 1
fi

归档数据库(全归档)

#!/bin/bash

##############################变量修改定义区################################

# 需要改表名,默认源和归档表是一致的
SOURCE_TABLE="表名"
BACKUP_TABLE="表名"

# 需要修改时间字段名
DATE_FIELD="时间字段名"

# ID字段或唯一字段(防止出现重复时间无法取值问题,如果不存在时间重复问题,可不设置,不设置默认使用DATE_FIELD变量)
ID_FIELD="ID字段或唯一字段"

if [ -z "$ID_FIELD" ];then
	FIELD_NAME=$DATE_FIELD
else
	FIELD_NAME=$ID_FIELD
fi

echo "FIELD_NAME参数为:$FIELD_NAME"
#############################以下是数据库连接###############################

# 归档目的MySQL数据库连接信息
DB_HOST="数据库连接地址 "
DB_USER="用户名"
DB_PASS="密码"
DB_NAME="库名"
PORT="端口"

# 归档源MySQL数据库连接信息
DB_HOST1="数据库连接地址"
DB_USER1="用户名"
DB_PASS1="密码"
DB_NAME1="库名"
PORT1="端口"

################################变量定义结束################################

#获取当天日期
TODAY_DATE=$(date +%Y-%m-%d)

#获取最近的一次数据时间,用于截止时间
TBL_NEW_TIME=$(mysql -h $DB_HOST1 -u $DB_USER1 -p$DB_PASS1 -P$PORT1 -D $DB_NAME1 -se "SELECT $DATE_FIELD FROM $DB_NAME1.$SOURCE_TABLE order by $DATE_FIELD DESC limit 1")

#获取当前表的总行数
START_TBL_TOTAL_LINE=$(mysql -h $DB_HOST1 -u $DB_USER1 -p$DB_PASS1 -P$PORT1 -D $DB_NAME1 -se "SELECT count(*) FROM $DB_NAME1.$SOURCE_TABLE where $DATE_FIELD <= '$TBL_NEW_TIME'")


# 获取创建时间字段的最大值和最小值(抓取指定字段当前日期的几年前之前的记录,并获取日期的最大和最小值)
MIN_DATE=$(mysql -h $DB_HOST1 -u $DB_USER1 -p$DB_PASS1 -P$PORT1 -D $DB_NAME1 -se "SELECT MIN($DATE_FIELD) FROM $DB_NAME1.$SOURCE_TABLE where $DATE_FIELD")
MAX_DATE=$(mysql -h $DB_HOST1 -u $DB_USER1 -p$DB_PASS1 -P$PORT1 -D $DB_NAME1 -se "SELECT MAX($DATE_FIELD) FROM $DB_NAME1.$SOURCE_TABLE where $DATE_FIELD")

#echo $MIN_DATE1
#echo $MAX_DATE1

#MIN_DATE=$(date -d "$MIN_DATE1" +%Y-%m-%d %H:%M:%S)
#MAX_DATE=$(date -d "$MAX_DATE1" +%Y-%m-%d %H:%M:%S)

echo $MIN_DATE
echo $MAX_DATE

# 将最小日期转换为日期格式
CURRENT_DATE=$(date -d "$MIN_DATE" +%Y-%m-%d)

# 循环操作,每次插入十万行数据到备份表
BATCH_SIZE=100000
OFFSET=0

while [[ "$CURRENT_DATE" < "$MAX_DATE" ]]; do
  NEXT_DATE=$(date -d "$CURRENT_DATE +1 days" +%Y-%m-%d)

  while true; do
    mysql -h $DB_HOST -u $DB_USER -p$DB_PASS -P$PORT -D $DB_NAME -e "
      INSERT INTO $BACKUP_TABLE
      SELECT * FROM jdbc_catalog.$DB_NAME1.$SOURCE_TABLE
      WHERE $DATE_FIELD >= '$CURRENT_DATE' AND $DATE_FIELD < '$NEXT_DATE'
      AND $DATE_FIELD >= '$MIN_DATE' AND $DATE_FIELD <= '$MAX_DATE'
      LIMIT $BATCH_SIZE OFFSET $OFFSET;
    "

    OFFSET=$((OFFSET + BATCH_SIZE))
  done

  # 更新日期和偏移量
  CURRENT_DATE=$NEXT_DATE
  OFFSET=0
done

echo "数据插入完成。"

#获取创建时间字段目的归档库总数和以及源库总数

SO_COUNT=$(mysql -h $DB_HOST -u $DB_USER -p$DB_PASS -P$PORT -D $DB_NAME -se "SELECT count(1) FROM $DB_NAME.$BACKUP_TABLE where $DATE_FIELD >= '$MIN_DATE' and $DATE_FIELD <= '$MAX_DATE' ")
DE_COUNT=$(mysql -h $DB_HOST1 -u $DB_USER1 -p$DB_PASS1 -P$PORT1 -D $DB_NAME1 -se "SELECT count(1) FROM $DB_NAME1.$SOURCE_TABLE where $DATE_FIELD >= '$MIN_DATE' and $DATE_FIELD <= '$MAX_DATE' ")


echo "Count from SO_COUNT: $SO_COUNT"
echo "Count from DE_COUNT: $DE_COUNT"

#对比归档的数据总量是否一致

if [ "$SO_COUNT" -eq "$DE_COUNT" ]; then
    echo "归档数据总行数对比一致"
else
    echo "【ERROR】归档数据总行数对比不一致"
    exit 1
fi

#随机获取创建时间字段的归档里面的一条数据和以及源库里面的一条数据


DATA_DATE1=$(date -d "$MAX_DATE" +%Y-%m-%d)
DATA_DATE2=$(date -d "$DATA_DATE1 -90 days" +%Y-%m-%d)

sr_data=$(mysql -h $DB_HOST -u $DB_USER -p$DB_PASS -P$PORT -D $DB_NAME -se "SELECT * FROM $DB_NAME.$BACKUP_TABLE where $DATE_FIELD < '$DATA_DATE1' and $DATE_FIELD >= '$DATA_DATE2' order by $FIELD_NAME DESC LIMIT 1 OFFSET 9")
tx_data=$(mysql -h $DB_HOST1 -u $DB_USER1 -p$DB_PASS1 -P$PORT1 -D $DB_NAME1 -se "SELECT * FROM $DB_NAME1.$SOURCE_TABLE where $DATE_FIELD < '$DATA_DATE1' and $DATE_FIELD >= '$DATA_DATE2' order by $FIELD_NAME DESC LIMIT 1 OFFSET 9")

echo "随机获取数据的最大时间范围为$DATA_DATE1"
echo "随机获取数据的最小时间范围为$DATA_DATE2"

# 判断两个变量是否为空  
if [ -z "$sr_data" ] || [ -z "$tx_data" ]; then  
    echo "【ERROR】获取第10行源数据/归档数据时,发现数据为空" && exit 1  
else  
    echo "获取第10行归档数据为:$sr_data"  
    echo "获取第10行源数据为:$tx_data"  
fi

MD5_1=$(echo -n "$sr_data" | md5sum | awk '{print $1}')
MD5_2=$(echo -n "$tx_data" | md5sum | awk '{print $1}')


echo "MD5 of data from sr_data: $MD5_1"
echo "MD5 of data from tx_data: $MD5_2"

#对比归档的数据其中一条数据的MD5是否一致

if [ "$MD5_1" == "$MD5_2" ]; then
    echo "数据MD5码对比一致"
else
    echo "【ERROR】数据MD5码对比不一致"
	exit 1
fi

#备份归档数据到本地文本

if mysqldump -h$DB_HOST1 -P$PORT1 -u$DB_USER1 -p$DB_PASS1 --databases $DB_NAME1 --tables $SOURCE_TABLE --where="$DATE_FIELD >= '$MIN_DATE' and $DATE_FIELD <= '$MAX_DATE'" --skip-add-drop-table --no-create-info --complete-insert > /home/archived_data/$SOURCE_TABLE-$TODAY_DATE.sql;then
#删除数据并备份数
	mysql -h $DB_HOST1 -u $DB_USER1 -p$DB_PASS1 -P$PORT1 -D $DB_NAME1 -se "DELETE FROM  $DB_NAME1.$SOURCE_TABLE where $DATE_FIELD >= '$MIN_DATE' and $DATE_FIELD <= '$MAX_DATE'"
else
	exit 1
fi

#归档后行数校验
#获取归档后行数,范围加上截止时间变量,防止数据新增导致行数不一致
END_TBL_TOTAL_LINE=$(mysql -h $DB_HOST1 -u $DB_USER1 -p$DB_PASS1 -P$PORT1 -D $DB_NAME1 -se "SELECT count(*) FROM $DB_NAME1.$SOURCE_TABLE where $DATE_FIELD <= '$TBL_NEW_TIME'")
if [ -z "$END_TBL_TOTAL_LINE" ];then
	echo "【ERROR】获取归档后行数失败!" && exit 1
else
	echo "归档后数据行数为:$END_TBL_TOTAL_LINE"
fi


# 计算差值
DIFFERENCE=$((START_TBL_TOTAL_LINE - END_TBL_TOTAL_LINE))

#校验行数生产库运行前行数-生产库归档后行数=已归档行数
if [ "$DIFFERENCE" -eq "$SO_COUNT" ];then
	echo "校验正常,$TODAY_DATE已归档数据与生产库差值数据相同"
else
	echo "【ERROR】校验异常,$TODAY_DATE已归档数据与生产库差值不相等,生产库差值行数为:$DIFFERENCE,已归档数据行数为:$SO_COUNT"
	exit 1
fi

### 回答1: 好的,我可以为您介绍如何编写一个简单的Shell脚本来备份MySQL数据库。这个脚本将使用`mysqldump`命令来备份数据库,并将备份文件压缩到一个tar归档文件中。 首先,您需要创建一个新的Shell脚本文件,比如说`backup_mysql.sh`,并将其保存到您的Linux服务器上。 接下来,您可以使用以下代码来编写脚本: ``` #!/bin/bash # 定义备份目录和文件名 BACKUP_DIR="/var/backups/mysql" DATE=$(date +%Y-%m-%d_%H-%M-%S) FILE_NAME="mydb_backup_$DATE.tar.gz" # 定义MySQL连接参数 USER="your_mysql_user" PASSWORD="your_mysql_password" HOST="localhost" DB_NAME="your_database_name" # 创建备份目录 mkdir -p $BACKUP_DIR # 使用mysqldump命令备份数据库 mysqldump -u $USER -p$PASSWORD -h $HOST $DB_NAME > $BACKUP_DIR/$DB_NAME.sql # 压缩备份文件到tar归档文件 tar -czvf $BACKUP_DIR/$FILE_NAME $BACKUP_DIR/$DB_NAME.sql # 删除原始备份文件 rm $BACKUP_DIR/$DB_NAME.sql ``` 请注意,您需要将`your_mysql_user`、`your_mysql_password`和`your_database_name`替换为您自己的MySQL连接参数。 一旦您保存了脚本文件并将其设置为可执行,您可以运行它来备份MySQL数据库。您可以使用以下命令: ``` ./backup_mysql.sh ``` 这将在`/var/backups/mysql`目录中创建一个新的tar归档文件,其中包含当前日期时间戳的名称。该归档文件将包含压缩的MySQL备份文件。 ### 回答2: shell脚本可以通过使用命令行工具mysqldump来备份MySQL数据库。以下是一个示例的shell脚本: ```shell #!/bin/bash # 设置备份目录和文件名 backup_dir="/path/to/backup" backup_file="mysql_backup_$(date '+%Y%m%d%H%M%S').sql" # MySQL连接信息 db_host="localhost" db_user="root" db_password="password" db_name="database_name" # 创建备份目录 mkdir -p "$backup_dir" # 备份MySQL数据库 mysqldump --host="$db_host" --user="$db_user" --password="$db_password" "$db_name" > "$backup_dir/$backup_file" # 检查备份是否成功 if [ $? -eq 0 ]; then echo "MySQL数据库备份成功。备份文件为:$backup_dir/$backup_file" else echo "MySQL数据库备份失败。" fi ``` 上述脚本首先定义了备份目录和文件名,然后指定了MySQL的连接信息。接下来,脚本创建了备份目录,并使用mysqldump命令备份MySQL数据库。备份文件的命名格式为"mysql_backup_年月日时分秒.sql"。最后,脚本通过检查mysqldump命令的返回值来确定备份是否成功,并输出相应的提示信息。 在使用这个脚本进行备份时,需要将脚本中的"/path/to/backup"、"localhost"、"root"、"password"和"database_name"分别替换为实际的备份目录、MySQL主机、用户名、密码和数据库名。 这个脚本可以通过在终端中执行"bash script.sh"来运行。 ### 回答3: shell脚本备份MySQL数据库是一种自动化备份数据库的方法。通过编写shell脚本,我们可以使用MySQL的命令行工具来备份数据库。 首先,我们需要在脚本中指定数据库的用户名和密码以及备份的目录。可以通过设置变量来保存这些信息。 然后,我们可以使用mysqldump命令来导出整个数据库或特定的表。例如,可以使用以下命令来备份整个数据库mysqldump -u username -ppassword --all-databases > backup.sql 这将导出所有数据库的内容,并将其保存在backup.sql文件中。 如果只需要备份特定的表,可以使用以下命令: mysqldump -u username -ppassword database_name table_name > backup.sql 这将导出指定数据库中的特定表,并将其保存在backup.sql文件中。 为了保存每次备份的文件,我们可以将备份文件命名为包含当前日期和时间的文件名。可以使用date命令来获取当前的日期和时间,并将其添加到备份文件名中。例如: backup_filename="backup_$(date +'%Y%m%d_%H%M%S').sql" 在脚本中,我们可以使用变量和重定向来将备份文件保存到指定的目录中。例如: backup_directory="/path/to/backup" mysqldump -u username -ppassword database_name > $backup_directory/$backup_filename 这将将备份文件保存在指定的目录中。 最后,我们可以设置脚本的执行权限,并使用cron来定期执行备份脚本。通过将脚本添加到cron作业中,我们可以自动定期备份数据库。 总之,通过编写shell脚本,我们可以轻松地备份MySQL数据库,并确保数据库的安全性和可恢复性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

你不是我的二狗子

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值