使用从Kafka connect实现从oracle到kafka的数据同步

最新推荐文章于 2024-08-16 09:13:36 发布

Walker_zmc

最新推荐文章于 2024-08-16 09:13:36 发布

阅读量3.1k

点赞数

分类专栏： Kafka

本文链接：https://blog.csdn.net/Walker_zmc/article/details/104008820

版权

Kafka 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

参考https://blog.csdn.net/ismr_m/article/details/79813838

https://mp.weixin.qq.com/s?src=11&timestamp=1579153063&ver=2099&signature=6tatHFHkl*dhNeA2L533wHUkaTxXUAgAhlflX5MqEMjIraCIfnOMN7e*JkFCBo0ZVv9RQMwTI42lS5d0ys2CwKW7aksHCGkv5Qyi6XSAeMZo6N7iyct8rq2Ct4txQoaN&new=1

confluent的包链接：https://pan.baidu.com/s/1JfCxRMd2eGdSGnWbrcd0Hg 提取码：uqx4

以上工具来源：https://blog.csdn.net/ismr_m/article/details/79813838（十分感谢）

一、创建oracle的数据

SQL> create table test_user(id number(19) not null primary key, username varchar2(100),password varchar2(100),modified timestamp(0) default SYSTIMESTAMP not null);

创建自增序列，使主键自增：

SQL> create sequence test_user_seq start with 1 increment by 1;

创建触发器：

SQL> create or replace trigger test_user_seq_tr

2 before insert or update on test_user for each row

3 begin

4 if inserting then

5 select test_user_seq.NEXTVAL into :new.id from dual;

6 end if;

7 END;

8 /

为时间列创建一个索引：

SQL> create index test_modified_index on test_user (modified);

插入数据:

SQL> insert into test_user(username,password) values('tom','111');

1 row created.

SQL> insert into test_user(username,password) values('bob','222');

1 row created.

SQL> insert into test_user(username,password) values('jhon','333');

1 row created.

SQL> insert into test_user(username,password) values('rose','444');

1 row created.

SQL> insert into test_user (username,password) values('amy','555');

1 row created.

SQL> commit;

这里要注意insert之后要commit一下，否则topic中读不到这条记录。

二、启动kafka

三、导入oracle驱动

将ojdbc的jar放入kafka安装包下的lib目录以及confluent工具下的share/java/kafka下。注意ojdbc.jar的版本要和jdk以及oracle的版本对应。我这里使用的是jdk1.8+oracle11g。

4.在kafka安装包下的config中的connect-standalone.properties文件中修改plugin.path：

最下面的地址指向你的share/java/kafka下

5.在config下创建一个connector的配置文件：

[root@localhost config]# vi wyh-oracle-connector.properties

添加如下内容：

name=test-oracle-connector

connector.class=io.confluent.connect.jdbc.JdbcSourceConnector

tasks.max=1

connection.password=wyhpwd

connection.url=jdbc:oracle:thin:@192.168.184.129:1522:orcl

connection.user=wyh

table.whitelist=TEST_USER

mode=incrementing

incrementing.column.name=ID

topic.prefix=test-oracle-

这里一定要注意在oracle内部表名和列名都是大写，所以配置中table.whitelist和incrementing.column.name都要大写，否则报错。此处的name是连接器名称，是唯一的，不能重复。connector.class是连接器的类名。在连接oracel时，username和password最好和url分开写，因为分开写会进行隐藏密码，否则直接写在url中会明文显示密码。table.whitelist是表示允许复制的表。mode表示增量查询的模式，也就是根据哪种模式来跟踪数据的更新。incrementing.column.name是具体以哪个列名来作为mode 下的跟踪。topic.prefix是在表很多的情况下可以根据topic的前缀对每一个表都有一个不同的topic，这里我们只有一个表。输出数据的topic就是topic.prefix加上表名。这个topic会自动创建。topic.prefix是必须指定的。

6.启动connector：

[root@localhost kafka_2.12-2.1.0]# bin/connect-standalone.sh config/connect-standalone.properties config/wyh-oracle-connector.properties

7.启动consumer：

[root@localhost kafka_2.12-2.1.0]# bin/kafka-console-consumer.sh --bootstrap-server 192.168.184.128:9092 --from-beginning --topic test-oracle-TEST_USER

当然，上面的192.168.184.128:9092应该换成各自的bootstrap.servers