使用canal同步mysql与ES以及代码同步缺失表id问题

最新推荐文章于 2024-01-22 07:00:00 发布

father_1227

最新推荐文章于 2024-01-22 07:00:00 发布

阅读量2.9k

点赞数 4

分类专栏： es+canal 文章标签： mysql elasticsearch java

本文链接：https://blog.csdn.net/weixin_41546244/article/details/108648000

版权

es+canal 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

canal增量同步与代码全量同步es全表缺失id问题,以及_id设置

背景/问题描述：

代码启动时候使用springboot启动将表数据全量同步，然后使用canal增量同步。
1.canal的配置：
/usr/local/canal-adapter/conf/es6：

dataSourceKey: XXX
outerAdapterKey: es-XXX
destination: XXX
groupId: XX
esMapping:
  _index: XX
  _type: doc
  _id: id
  upsert: true
#  pk: id
  sql: " select id, goods_code as goodsCode....from goods "
  #etlCondition: "where id<='{0}'" #etl的条件参数，可以将之前没能同步的数据同步，数据量大的话可以用logstash
  commitBatch: 3000

2.代码批量同步：

public <T> void batchSave(String esIndex, String esType, List<T> list) throws IOException, NoSuchFieldException, IllegalAccessException {
    if (null == list || list.size() == 0) {
        return;
    }
    BulkRequest request = new BulkRequest();
    //设置超时时间
    request.timeout("XX");
    for (T dto : list) {
        Map map = BeanUtil.entityToMap(dto);
        Object id = map.get("id");
        request.add(new IndexRequest(esIndex, esType, id.toString()).source(JSON.toJSONString(dto), XContentType.JSON));
    }
    try {
        BulkResponse responses = client.bulk(request);
        if (responses.hasFailures()) {
            logger.error("索引:{}..同步结果存在错误:{}", esIndex, responses.hasFailures());
        } else {
            logger.info("索引:{}..同步完成", esIndex);
        }
    } catch (IOException e) {
        logger.error("索引:{}..存储es异常:{}", esIndex, e.toString());
    }
}