【Kafka学习】源码系列(一)阅读前工作

前言:kafka 2.8+已经 “抛弃” 了Zookeeper(CP模型,即要保证数据的强一致性,必然在可用性方面做出牺牲),使用了Raft
所以笔者这里选择了较稳定的2.7版本

一、工程目录结构

在这里插入图片描述

  • bin: 启动脚本;
  • clients:生产者和消费者代码;
  • config: 配置文件;
  • core : kafka server端,scala语言开发,实现了集群管理,分区副本管- 理,消息存储和消息获取,网络通信等功能;
  • docs:kakfa文档
  • examples:生产者消费者demo 启动脚本;
  • streams:kafka 流相关代码;
  • jmh-benchmarks:JMH测试;
  • log4j-appender:日志处理;
  • tools:工具包;

二、核心-core 目录

在这里插入图片描述

  • admin包:执行管理命令的功能;
  • api 包: 封装请求和响应DTO对象;
  • cluster包:集群对象,例如Replica 类代表一个分区副本,Partition类代表一个分区;
  • common包: 通用jar包;
  • controller包: 和kafkaController(kc)相关的类,重点模块,一个kafka集群只有一个leader kc,该kc负责 分区管理,副本管理,并保证集群信息在集群中同步;
  • coordinator包:组协调者相关,负责处理消费者组的代码;
  • log包: 磁盘存储相关,重点模块;
  • network包: 网络相关,重点模块,使用的是NIO,从这里可学习如何应用java 的NIO类;
  • consumer包,producer好多废弃类,无需关注;
  • server包: kafka实例的各种管理类,核心包,也是重点;
  • tools: 工具类

三、核心-client目录

在这里插入图片描述

  • clients 包:生产者producer 和消费者consumer的代码
  • common 包:常用方法和工具包
  • server 包:服务端方法接口

四、准备工作

1、启动Zookeeper
在这里插入图片描述

2、解决每次执行debug都要执行很多task,时间很久。需要修改Idea
这里两项都修改为Intellij IDEA
在这里插入图片描述
3、设置日志输出路径
kafka.logs.dir=/tmp/kafka-logs (自行定义,不定义则直接输出工程所在盘符)
在这里插入图片描述

五、开始阅读

先运行:core/src/main/scala/kafka/Kafka.scala
在这里插入图片描述
接着找到入口java类:这里我为了方便debug,已经修改了部分代码
examples/src/main/java/kafka/examples/KafkaConsumerProducerDemo.java

package kafka.examples;

import java.util.concurrent.CountDownLatch;

public class KafkaConsumerProducerDemo {

    /**
     * 读取源码入口
     * @param args
     * @throws InterruptedException
     */
    public static void main(String[] args) throws InterruptedException {

        // kafka默认都是通过异步发送消息
        boolean isAsync = args.length == 0 || !args[0].trim().equalsIgnoreCase("sync");

        CountDownLatch latch = new CountDownLatch(1);

        // 启动一个Producer线程, 循环发送消息
        Producer producerThread = new Producer(KafkaProperties.TOPIC, isAsync, null, false, 1, -1, latch);
        producerThread.start();

        //启动一个Consumer线程, 循环消费消息
        /*Consumer consumerThread = new Consumer(KafkaProperties.TOPIC, "DemoConsumer", Optional.empty(), false, 1, latch);
        consumerThread.start();

        if (!latch.await(5, TimeUnit.MINUTES)) {
            throw new TimeoutException("Timeout after 5 minutes waiting for demo producer and consumer to finish");
        }*/

        // consumerThread.shutdown();
        System.out.println("All finished!");
    }
}

到了这里我们就可以直接Debug开始阅读Kafka源码了

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Kafka Connect是一个用于数据集成的开源工具,它是Apache Kafka项目的一部分。Kafka Connect旨在简化将数据从不同的数据源和数据目的地流动到Kafka集群的过程。 Kafka Connect的源码是以Java语言编写的,它包含了连接器和转换器等关键组件。连接器是负责从数据源中读取数据并将其写入Kafka的组件,它们支持许多常见的数据源,如数据库、文件系统、消息队列等。转换器用于对读取的数据进行转换和处理,以便在不同的数据格式和结构之间进行映射。 源码中的关键类包括Connector、Task、SinkTask和SourceTask。Connector类是连接器的主要实现,它负责配置和启动连接器的任务。每个连接器可以有一个或多个任务,Task类是连接器任务的抽象基类,负责实际的数据读写操作。SinkTask是将数据写入Kafka集群的任务,而SourceTask是从数据源中读取数据的任务。 Kafka Connect的源码还包含了许多其他的实用类和工具,用于处理连接器的配置、监控连接器的运行状态、处理错误和故障等。源码中的关键逻辑包括数据的序列化和反序列化、数据的转换和处理、连接器的动态扩展和配置的管理等。 通过研究Kafka Connect的源码,我们可以深入理解它的工作原理和实现细节,从而更好地使用和扩展Kafka Connect,满足各种数据集成的需求。我们可以通过修改或扩展源码来适应特定的数据源和数据目的地,并通过调试源码来解决连接器运行中的问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

张小帅和刘美美

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值