数据同步-全量和增量

因为公司的需求人员说的含糊其词的,原先我以为是关于本身业务的,但是 昨天赶上当当的满100-50我在挑书看到了技术书里面有一章是介绍的是数据同步这个概念,于是上网搜关于这种的资料。

参考https://www.cnblogs.com/big1987/p/8522884.html

1.同步方式

 数据同步一般分为两种方式:全量和增量。

1.1  全量

全量,这个很好理解。就是每天定时(避开业务高峰期)或者周期性全量把数据从一个地方拷贝到另外一个地方;

全量的话,可以采用直接全部覆盖(使用“新”数据覆盖“旧”数据);或者走更新逻辑(覆盖前判断下,如果新旧不一致,就更新);

 

1.2 增量

增量的基础是全量,就是你要使用某种方式先把全量数据拷贝过来,然后再采用增量方式同步更新。

 

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Spring Boot 整合 Easy-ES、Canal 和 Kafka 可以实现 MySQL 数据全量增量同步。下面简单介绍一下具体步骤: 1. 集成 Easy-ES (1)在 pom.xml 中添加 Easy-ES 依赖: ``` <dependency> <groupId>com.alibaba</groupId> <artifactId>easy-es-spring-boot-starter</artifactId> <version>2.3.0</version> </dependency> ``` (2)在 application.yml 中配置 Easy-ES: ``` spring: elasticsearch: rest: uris: http://127.0.0.1:9200 easy-es: enabled: true index-prefix: my_index refresh-interval: 5s ``` 2. 集成 Canal (1)在 pom.xml 中添加 Canal 依赖: ``` <dependency> <groupId>com.alibaba.otter</groupId> <artifactId>canal.client</artifactId> <version>1.1.4</version> </dependency> ``` (2)在 application.yml 中配置 Canal: ``` canal: client: # canal server的ip地址和端口号 servers: 127.0.0.1:11111 # 监听的实例名称,多个实例用逗号分隔 instance: my_instance # 连接 Canal server 的用户名和密码 username: password: destination: # 数据源名称 schema: my_db # 数据库连接信息 url: jdbc:mysql://127.0.0.1:3306/my_db?serverTimezone=Asia/Shanghai&useUnicode=true&characterEncoding=utf-8 username: root password: root filter: # 监听表的正则表达式,多个表用逗号分隔 include: .*\\..* ``` 3. 集成 Kafka (1)在 pom.xml 中添加 Kafka 依赖: ``` <dependency> <groupId>org.springframework.kafka</groupId> <artifactId>spring-kafka</artifactId> <version>2.5.4.RELEASE</version> </dependency> ``` (2)在 application.yml 中配置 Kafka: ``` spring: kafka: bootstrap-servers: 127.0.0.1:9092 producer: retries: 0 consumer: group-id: my_group_id auto-offset-reset: earliest properties: max.poll.interval.ms: 600000 ``` 4. 实现数据同步 (1)全量同步 全量同步可以通过 Easy-ES 的 `com.alibaba.easysearch.indexbuilder.IndexBuilderFactory` 类来实现。在应用启动时,通过监听 `ApplicationReadyEvent` 事件,获取 MySQL 数据调用 `com.alibaba.easysearch.indexbuilder.IndexBuilderFactory.buildFullIndex()` 方法来创建索引,具体代码如下: ``` @Component public class FullIndexBuilder implements ApplicationListener<ApplicationReadyEvent> { @Autowired private IndexBuilderFactory indexBuilderFactory; @Override public void onApplicationEvent(ApplicationReadyEvent applicationReadyEvent) { // 获取 MySQL 数据并创建索引 indexBuilderFactory.buildFullIndex(); } } ``` (2)增量同步 增量同步可以通过 Canal 和 Kafka 实现。Canal 监听 MySQL 数据库变化,将变化信息发送到 Kafka 中,然后在消费者中获取变化信息并更新索引。 首先创建一个 Canal 客户端: ``` @Component public class CanalClient { private static final Logger logger = LoggerFactory.getLogger(CanalClient.class); @Autowired private KafkaTemplate<String, String> kafkaTemplate; @Value("${canal.client.servers}") private String servers; @Value("${canal.client.instance}") private String instance; @PostConstruct public void init() { CanalConnector connector = CanalConnectors.newClusterConnector(servers, instance, "", ""); int batchSize = 1000; try { connector.connect(); connector.subscribe(".*\\..*"); connector.rollback(); while (true) { Message message = connector.getWithoutAck(batchSize); long batchId = message.getId(); if (batchId == -1 || message.getEntries().isEmpty()) { continue; } List<String> messages = new ArrayList<>(); for (CanalEntry.Entry entry : message.getEntries()) { if (entry.getEntryType() == CanalEntry.EntryType.ROWDATA) { RowChange rowChange; try { rowChange = RowChange.parseFrom(entry.getStoreValue()); } catch (Exception e) { throw new RuntimeException("ERROR ## parser of eromanga-event has an error , data:" + entry.toString(), e); } String tableName = entry.getHeader().getTableName(); EventType eventType = rowChange.getEventType(); for (CanalEntry.RowData rowData : rowChange.getRowDatasList()) { String messageJson = JSON.toJSONString(rowData.getAfterColumnsList() .stream() .collect(Collectors.toMap(CanalEntry.Column::getName, CanalEntry.Column::getValue))); messages.add(tableName + "|" + eventType + "|" + messageJson); } } } if (!messages.isEmpty()) { kafkaTemplate.send("my_topic", StringUtils.join(messages, "\n")); } connector.ack(batchId); } } catch (Exception e) { logger.error("CanalClient error", e); } finally { connector.disconnect(); } } } ``` 然后创建一个 Kafka 消费者,获取变化信息并更新索引: ``` @Component public class IncrementIndexBuilder { private static final Logger logger = LoggerFactory.getLogger(IncrementIndexBuilder.class); @Autowired private IndexBuilderFactory indexBuilderFactory; @KafkaListener(topics = "my_topic") public void listen(ConsumerRecord<String, String> record) { String[] fields = StringUtils.split(record.value(), "|"); String tableName = fields[0]; String eventType = fields[1]; String messageJson = fields[2]; try { Map<String, Object> message = JSON.parseObject(messageJson, new TypeReference<Map<String, Object>>() {}); if ("INSERT".equals(eventType)) { indexBuilderFactory.buildIndex(tableName, message); } else if ("UPDATE".equals(eventType)) { indexBuilderFactory.updateIndex(tableName, message); } else if ("DELETE".equals(eventType)) { indexBuilderFactory.deleteIndex(tableName, message); } } catch (Exception e) { logger.error("IncrementIndexBuilder error", e); } } } ``` 到此为止,我们就实现了 Spring Boot 整合 Easy-ES、Canal 和 Kafka 实现 MySQL 数据全量增量同步

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值