DataX，数据同步工具，亲测真香，2024年最新2024京东软件测试面试真题

2401_84247617

于 2024-04-15 03:23:16 发布

阅读量1.8k

点赞数 10

分类专栏： 2024年程序员学习文章标签：面试职场和发展

本文链接：https://blog.csdn.net/2401_84247617/article/details/137761156

版权

2024年程序员学习专栏收录该内容

113 篇文章 2 订阅

订阅专栏

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7

深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年最新软件测试全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上软件测试知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

如果你需要这些资料，可以添加V获取：vip1024b （备注软件测试）

正文

{
“reader”: {
“name”: “streamreader”,
“parameter”: {
“column”: [ # 同步的列名 (* 表示所有)
{
“type”:“string”,
“value”:“Hello.”
},
{
“type”:“string”,
“value”:“河北彭于晏”
},
],
“sliceRecordCount”: “3” # 打印数量
}
},
“writer”: {
“name”: “streamwriter”,
“parameter”: {
“encoding”: “utf-8”, # 编码
“print”: true
}
}
}
],
“setting”: {
“speed”: {
“channel”: “2” # 并发 (即 sliceRecordCount * channel = 结果)
}
}
}
}

输出：（要是复制我上面的话，需要把 # 带的内容去掉）

安装 MySQL 数据库

分别在两台主机上安装：

[root@MySQL-1 ~]# yum -y install mariadb mariadb-server mariadb-libs mariadb-devel
[root@MySQL-1 ~]# systemctl start mariadb # 安装 MariaDB 数据库
[root@MySQL-1 ~]# mysql_secure_installation # 初始化
NOTE: RUNNING ALL PARTS OF THIS SCRIPT IS RECOMMENDED FOR ALL MariaDB
SERVERS IN PRODUCTION USE! PLEASE READ EACH STEP CAREFULLY!

Enter current password for root (enter for none): # 直接回车
OK, successfully used password, moving on…
Set root password? [Y/n] y # 配置 root 密码
New password:
Re-enter new password:
Password updated successfully!
Reloading privilege tables…
… Success!
Remove anonymous users? [Y/n] y # 移除匿名用户
… skipping.
Disallow root login remotely? [Y/n] n # 允许 root 远程登录
… skipping.
Remove test database and access to it? [Y/n] y # 移除测试数据库
… skipping.
Reload privilege tables now? [Y/n] y # 重新加载表
… Success!

1）准备同步数据（要同步的两台主机都要有这个表）

MariaDB [(none)]> create database course-study;
Query OK, 1 row affected (0.00 sec)

MariaDB [(none)]> create table course-study.t_member(ID int,Name varchar(20),Email varchar(30));
Query OK, 0 rows affected (0.00 sec)

因为是使用 DataX 程序进行同步的，所以需要在双方的数据库上开放权限：

grant all privileges on . to root@‘%’ identified by ‘123123’;
flush privileges;

2）创建存储过程：

DELIMITER $CREATE PROCEDURE test() BEGIN declare A int default 1; while (A < 3000000)do insert into `course-study`.t_member values(A,concat("LiSa",A),concat("LiSa",A,"@163.com")); set A = A + 1; END while; END$
DELIMITER ;

正在上传…重新上传取消

图片

3）调用存储过程（在数据源配置，验证同步使用)：

call test();

通过 DataX 实 MySQL 数据同步

1）生成 MySQL 到 MySQL 同步的模板：

[root@MySQL-1 ~]# python /usr/local/datax/bin/datax.py -r mysqlreader -w mysqlwriter
{
“job”: {
“content”: [
{
“reader”: {
“name”: “mysqlreader”, # 读取端
“parameter”: {
“column”: [], # 需要同步的列 (* 表示所有的列)
“connection”: [
{
“jdbcUrl”: [], # 连接信息
“table”: [] # 连接表
}
],
“password”: “”, # 连接用户
“username”: “”, # 连接密码
“where”: “” # 描述筛选条件
}
},
“writer”: {
“name”: “mysqlwriter”, # 写入端
“parameter”: {
“column”: [], # 需要同步的列
“connection”: [
{
“jdbcUrl”: “”, # 连接信息
“table”: [] # 连接表
}
],
“password”: “”, # 连接密码
“preSql”: [], # 同步前. 要做的事
“session”: [],
“username”: “”, # 连接用户
“writeMode”: “” # 操作类型
}
}
}
],
“setting”: {
“speed”: {
“channel”: “” # 指定并发数
}
}
}
}

2）编写 json 文件：

[root@MySQL-1 ~]# vim install.json
{
“job”: {
“content”: [
{
“reader”: {
“name”: “mysqlreader”,
“parameter”: {
“username”: “root”,
“password”: “123123”,
“column”: [““],
“splitPk”: “ID”,
“connection”: [
{
“jdbcUrl”: [
“jdbc:mysql://192.168.1.1:3306/course-study?useUnicode=true&characterEncoding=utf8”
],
“table”: [“t_member”]
}
]
}
},
“writer”: {
“name”: “mysqlwriter”,
“parameter”: {
“column”: [””],
“connection”: [
{
“jdbcUrl”: “jdbc:mysql://192.168.1.2:3306/course-study?useUnicode=true&characterEncoding=utf8”,
“table”: [“t_member”]
}
],
“password”: “123123”,
“preSql”: [
“truncate t_member”
],
“session”: [
“set session sql_mode=‘ANSI’”
],
“username”: “root”,
“writeMode”: “insert”
}
}
}
],
“setting”: {
“speed”: {
“channel”: “5”
}
}
}
}

3）验证

[root@MySQL-1 ~]# python /usr/local/datax/bin/datax.py install.json

输出：

2021-12-15 16:45:15.120 [job-0] INFO JobContainer - PerfTrace not enable!
2021-12-15 16:45:15.120 [job-0] INFO StandAloneJobContainerCommunicator - Total 2999999 records, 107666651 bytes | Speed 2.57MB/s, 74999 records/s | Error 0 records, 0 bytes | All Task WaitWriterTime 82.173s | All Task WaitReaderTime 75.722s | Percentage 100.00%
2021-12-15 16:45:15.124 [job-0] INFO JobContainer -
任务启动时刻 : 2021-12-15 16:44:32
任务结束时刻 : 2021-12-15 16:45:15
任务总计耗时 : 42s
任务平均流量 : 2.57MB/s
记录写入速度 : 74999rec/s
读出记录总数 : 2999999
读写失败总数 : 0

你们可以在目的数据库进行查看，是否同步完成。

上面的方式相当于是完全同步，但是当数据量较大时，同步的时候被中断，是件很痛苦的事情；
所以在有些情况下，增量同步还是蛮重要的。

使用 DataX 进行增量同步

使用 DataX 进行全量同步和增量同步的唯一区别就是：增量同步需要使用 where 进行条件筛选。 （即，同步筛选后的 SQL）

1）编写 json 文件：

[root@MySQL-1 ~]# vim where.json
{
“job”: {
“content”: [
{
“reader”: {
“name”: “mysqlreader”,
“parameter”: {
“username”: “root”,
“password”: “123123”,
“column”: [““],
“splitPk”: “ID”,
“where”: “ID <= 1888”,
“connection”: [
{
“jdbcUrl”: [
“jdbc:mysql://192.168.1.1:3306/course-study?useUnicode=true&characterEncoding=utf8”
],
“table”: [“t_member”]
}
]
}
},
“writer”: {
“name”: “mysqlwriter”,
“parameter”: {
“column”: [””],
“connection”: [
{
“jdbcUrl”: “jdbc:mysql://192.168.1.2:3306/course-study?useUnicode=true&characterEncoding=utf8”,
“table”: [“t_member”]
}
],
“password”: “123123”,
“preSql”: [
“truncate t_member”
],
“session”: [
“set session sql_mode=‘ANSI’”
],
“username”: “root”,
“writeMode”: “insert”
}
}
}
],
“setting”: {
“speed”: {
“channel”: “5”
}
}
}
}

需要注意的部分就是：where（条件筛选）和 preSql（同步前，要做的事）参数。

2）验证：

[root@MySQL-1 ~]# python /usr/local/data/bin/data.py where.json

输出：

2021-12-16 17:34:38.534 [job-0] INFO JobContainer - PerfTrace not enable!
2021-12-16 17:34:38.534 [job-0] INFO StandAloneJobContainerCommunicator - Total 1888 records, 49543 bytes | Speed 1.61KB/s, 62 records/s | Error 0 records, 0 bytes | All Task WaitWriterTime 0.002s | All Task WaitReaderTime 100.570s | Percentage 100.00%
2021-12-16 17:34:38.537 [job-0] INFO JobContainer -
任务启动时刻 : 2021-12-16 17:34:06
任务结束时刻 : 2021-12-16 17:34:38
任务总计耗时 : 32s
任务平均流量 : 1.61KB/s
记录写入速度 : 62rec/s
读出记录总数 : 1888
读写失败总数 : 0

目标数据库上查看：

3)基于上面数据，再次进行增量同步：

主要是 where 配置：“where”: “ID > 1888 AND ID <= 2888” # 通过条件筛选来进行增量同步
同时需要将我上面的 preSql 删除(因为我上面做的操作时 truncate 表)

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以添加V获取：vip1024b （备注软件测试）

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！
e1dbda404e3070977d.png)

3)基于上面数据，再次进行增量同步：

主要是 where 配置：“where”: “ID > 1888 AND ID <= 2888” # 通过条件筛选来进行增量同步
同时需要将我上面的 preSql 删除(因为我上面做的操作时 truncate 表)

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以添加V获取：vip1024b （备注软件测试）
[外链图片转存中…(img-HY0dMKdX-1713122578232)]

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

2401_84247617

关注

10
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
DataX，数据同步工具，亲测真香，2024年最新2024京东软件测试面试真题

root@MySQL-1 ~]# mysql_secure_installation # 初始化。任务启动时刻 : 2021-12-15 16:44:32。任务结束时刻 : 2021-12-15 16:45:15。任务启动时刻 : 2021-12-16 17:34:06。任务结束时刻 : 2021-12-16 17:34:38。
复制链接

扫一扫