https://www.yuque.com/docs/share/9f9a40ea-a76f-472e-a2d0-ead1bd43746d?# 《利用 maxwell-bootstrap 初始化数据》
利用 maxwell-bootstrap 初始化数据
假设现在gmall202004 数据库里面有 base_province表需要通过maxwell初始化一下
初始化省份表命令:
bin/maxwell-bootstrap --user maxwell --password 123456 --host zjj101 --database gmall202004 --table base_province --client_id maxwell_1
命令参数说明:
–user maxwell
数据库分配的操作 maxwell 数据库的用户名
–password 123456
数据库分配的操作 maxwell 数据库的密码
–host
数据库主机名
–database
数据库名
–table
表名
–client_id
maxwell-bootstrap 不具备将数据直接导入 kafka或者 hbase 的能力,通过–client_id指定将数据交给哪个 maxwell 进程处理,在 maxwell 的 conf.properties 中配置
host=zjj101
user=maxwell
password=123456
client_id=maxwell_1
执行完了之后你就会发现Kafka你配置的topic多了一些同步的数据
使用 bin/maxwell-bootstrap 同步原始数据的时候,会生成两条标记起始和结束的 json 字符串,这两条数据的 data 属性是 null 的,并且 type 属性也和原来的标记不一样,例如:插入操作标记位 bootstrap-insert