Debezium
文章平均质量分 81
TracyGao01
保持专注
展开
-
Debezium:数据实时采集从Postgresql到Kafka
目的:构建基于hbase的实时数仓解决的问题:RDBMS到Hbase的数据实时采集方法:Postgresql -----> Debezium -----> Kafka ------> Sparkstreaming ------> Phoenix本文:本文主要是从Postgresql到Kafka,不包括后...原创 2018-09-21 14:31:22 · 11005 阅读 · 3 评论 -
Debezium:kafka 连接器配置
目的:构建基于hbase的实时数仓解决的问题:RDBMS到Hbase的数据实时采集方法:Postgresql----->Debezium----->Kafka------>Sparkstreaming------>Phoenix本文:本文主要是kafka连接器一些相关配置官网参考地址...原创 2018-10-24 19:48:58 · 8470 阅读 · 1 评论 -
Debezium:数据类型numeric、decimal由PostgreSql输出到kafka后类型不匹配问题
环境:Debezium版本:0.8.3PostgreSql版本:9.5Kafka版本:CDK3.1.0(KAFKA:1.0.1)问题:Debezium从postgresql解析数据到kafka后,发现numeric类型数据输出格式异常,如下:{"scale":0,"value":"F3A="}原值为6000解决:需要配置参数,更新kafka连接器配置"decim...原创 2018-10-30 18:57:44 · 2947 阅读 · 1 评论 -
Debezium:关于Postgresql9.5版本不支持断点续传问题解决
前言:Debezium官方源码只支持pg9.6以上版本的流复制断点续传,9.5版本及其以下版本一旦任务失败,流复制连接无法重启,数据无法实现自动恢复解决:这里采用修改源代码的形式来解决9.5版本的支持问题插件版本:Debezium:debezium-0.8.4Postgresql:9.5解决方法:1、下载官方源代码(这里我下载的0.8版本的源代码)https:/...原创 2018-11-20 15:33:30 · 1813 阅读 · 3 评论 -
Debezium:mysql connector安装
前言:debezium提供了多种基于kafka的连接器,方便对RDB做数据流处理,包括:MongoDB,Oracle,Mysql,SqlServer,Postgresql,可扩展性强,代码可控,本篇介绍基于mysql的安装使用插件版本:Kafka:CDK3.10 (相当于Kafka1.1版本),这里需要kafka 0.10以上版本才能支持Debezium:0.83Mysql:5...原创 2018-11-19 19:22:53 · 2655 阅读 · 1 评论 -
Debezium:mysql connector使用
前言:mysql connector支持功能:1、数据流式处理2、支持多种模式mysql集群的数据处理3、支持流复制异常中断后的数据自动恢复4、支持DDL级别操作的数据流处理备注:本文以kafka单节点开发环境为例,多节点分布式连接器相似,参考:https://blog.csdn.net/u012551524/article/details/83349324插件版本:...原创 2018-11-19 19:31:35 · 5097 阅读 · 0 评论 -
Debezium:Spark Structured Streaming将Kafka的数据写入ElasticSearch
前言:1、数据流Mysql -> Debezium -> Kafka -> Structured Streaming ->ElasticSearch2、Mysql -> Debezium -> Kafka 参考https://blog.csdn.net/u012551524/article/details/842585653、ES/Spar...原创 2018-12-28 19:27:43 · 2359 阅读 · 1 评论 -
Debezium:postgresql ddl操作审计同步
1、Debezium目前魔仍只能同步到dml操作,如果做细粒度的ddl操作需要自己定制化操作2、Debezium-postgresql参考:https://blog.csdn.net/u012551524/article/details/82798066计划:以触发器的形式对postgresql ddl做审计同步,将ddl操作审计记录到表,对表进行同步,完成ddl同步create ...原创 2018-12-31 20:29:20 · 1346 阅读 · 0 评论 -
Postgresql热切换情况下通过流复制完成数据到Hbase的实时同步
插件版本:Postgresql:9.6Debezium:debezium-0.8.3Sqoop:1.4.7目标:1、通过流复制的形式实现数据从Postgresql到Hbase的实时同步2、Postgresql两个节点在热切换时保证数据的完整性流程如下图:要解决的问题:如上图Postgresql1与Postgresql2之间为热切换关系,一旦Postgresq...原创 2019-03-25 19:37:36 · 1140 阅读 · 1 评论