kafka的生产者和消费者原理

jxzhealthy

已于 2023-06-21 10:05:54 修改

阅读量689

点赞数

文章标签： kafka java 分布式

于 2023-06-21 10:03:19 首次发布

本文链接：https://blog.csdn.net/a920885285/article/details/131321869

版权

Kafka是一种分布式的消息系统，它的生产者和消费者是Kafka的核心组件。在Kafka中，生产者负责将消息发送到Kafka集群中，而消费者则从Kafka集群中读取消息。

Kafka生产者

Kafka生产者是将消息发送到Kafka集群的组件。生产者将消息发送到一个或多个主题（Topic）中，每个主题可以分为多个分区（Partition）。每个分区中的消息都是有序的，而不同分区之间的消息则是无序的。

消息发送流程

Kafka生产者发送消息的流程如下：

连接Kafka集群：生产者需要连接到Kafka集群中的一个或多个Broker节点。
发送消息：生产者将消息发送到指定的主题中，Kafka集群会根据主题和分区将消息存储到对应的Broker节点中。
确认消息：生产者会收到一个确认消息（Acknowledgment）来确认消息已经被成功发送到Kafka集群中。

消息可靠性

在Kafka中，消息的可靠性非常重要。为了确保消息不会丢失或重复发送，Kafka采用了以下两种机制：

消息复制：在Kafka中，每个分区都有多个副本（Replica），这些副本会自动同步主副本（Leader）中的数据。当主副本出现故障时，Kafka会自动选择一个副本作为新的主副本，以保证数据不会丢失。
消息确认：当生产者向Kafka发送一条消息时，它会收到一个确认消息来确认该消息已经被成功发送到Kafka集群中。如果生产者没有收到确认消息，则会尝试重新发送该消息。

生产者参数配置

Kafka生产者可以通过配置参数来控制其行为。以下是一些常用的配置参数：

bootstrap.servers：指定Kafka集群中Broker节点的地址。
acks：指定需要多少个副本确认才算成功，默认值为1。
retries：指定在发生错误时需要重试多少次，默认值为0。
batch.size：指定每次批量发送的消息数量，默认值为16384字节。
linger.ms：指定在发送之前等待的时间，默认值为0毫秒。
buffer.memory：指定生产者可用于缓存未发送消息的内存大小，默认值为33554432字节。

引入依赖

在使用Kafka之前，需要引入Kafka相关的依赖。在Maven项目中，可以在pom.xml文件中添加以下依赖：

<dependency>
    <groupId>org.apache.kafka</groupId>
    <artifactId>kafka-clients</artifactId>
    <version>2.5.0</version>
</dependency>

创建Kafka生产者

示例代码：

import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.ProducerRecord;
import java.util.Properties;

public class KafkaProducerDemo {

    public static void main(String[] args) {
        // 配置Kafka集群信息
        Properties props = new Properties();
        props.put("bootstrap.servers", "localhost:9092");
        props.put("acks", "all");
        props.put("retries", 0);
        props.put("batch.size", 16384);
        props.put("linger.ms", 1);
        props.put("buffer.memory", 33554432);
        props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
        props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        // 创建Kafka生产者
        KafkaProducer<String, String> producer = new KafkaProducer<>(props);

        // 发送消息
        String topic = "test-topic";
        String message = "Hello, Kafka!";
        ProducerRecord<String, String> record = new ProducerRecord<>(topic, message);
        producer.send(record);

        // 关闭Kafka生产者
        producer.close();
    }

}

Kafka消费者

Kafka消费者是从Kafka集群中读取消息的组件。消费者可以订阅一个或多个主题，并从指定的分区中读取数据。消费者可以以不同的方式处理数据，例如将数据写入数据库、打印日志等。

消息读取流程

Kafka消费者读取消息的流程如下：

连接Kafka集群：消费者需要连接到Kafka集群中的一个或多个Broker节点。
订阅主题：消费者通过调用subscribe()方法订阅一个或多个主题。
读取消息：消费者通过调用poll()方法从订阅的主题中读取数据。

消息处理方式

Kafka消费者可以以不同的方式处理数据。以下是一些常用的处理方式：

将数据写入数据库：消费者可以将读取到的数据写入数据库中，以便后续查询和分析。
打印日志：消费者可以将读取到的数据打印到日志文件中，以便后续排查问题。
发送邮件或短信：消费者可以根据读取到的数据发送邮件或短信通知。

消费者参数配置

Kafka消费者可以通过配置参数来控制其行为。以下是一些常用的配置参数：

bootstrap.servers：指定Kafka集群中Broker节点的地址。
group.id：指定消费者所属的组ID。
auto.offset.reset：指定当消费者第一次连接到Kafka集群时如何处理未提交的偏移量，默认值为latest。
enable.auto.commit：指定是否自动提交偏移量，默认值为true。
max.poll.records：指定每次调用poll()方法最多返回多少条记录，默认值为500。
key.deserializer：消息的键的反序列化器。
value.deserializer：消息的值的反序列化器。

引入Kafka依赖

首先需要在项目中引入Kafka的依赖，可以使用Maven或Gradle进行管理。

Maven依赖：

<dependency>
    <groupId>org.apache.kafka</groupId>
    <artifactId>kafka-clients</artifactId>
    <version>2.8.0</version>
</dependency>

创建Kafka消费者
示例代码：

import org.apache.kafka.clients.consumer.ConsumerConfig;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;
import org.apache.kafka.common.serialization.StringDeserializer;

import java.time.Duration;
import java.util.Collections;
import java.util.Properties;

public class MyConsumer {
    public static void main(String[] args) {
        Properties props = new Properties();
        props.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, "localhost:9092");
        props.put(ConsumerConfig.GROUP_ID_CONFIG, "my-group");
        props.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName());
        props.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName());

        KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);

        consumer.subscribe(Collections.singletonList("my-topic"));

        while (true) {
            ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
            records.forEach(record -> {
                System.out.println("Received message: key=" + record.key() + ", value=" + record.value());
            });
        }
    }
}

总结

Kafka生产者和消费者的工作原理。在使用Kafka时，需要注意以下几点：

生产者和消费者都需要连接到Kafka集群中的Broker节点。
生产者需要将消息发送到指定的主题中，而消费者需要订阅指定的主题。
在使用生产者时，需要注意消息的可靠性，可以通过配置参数来控制其行为。
在使用消费者时，需要注意偏移量的提交和处理方式，可以通过配置参数来控制其行为。

jxzhealthy

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
kafka的生产者和消费者原理

Kafka的生产者和消费者的工作原理。Kafka生产者负责将消息发送到Kafka集群中，每个主题可以分为多个分区，消息可靠性非常重要，Kafka采用消息复制和确认消息机制来保证消息不会丢失或重复发送。Kafka消费者是从Kafka集群中读取消息的组件，可以订阅一个或多个主题，并从指定的分区中读取数据。消费者可以以不同的方式处理数据，如将数据写入数据库、打印日志、发送邮件等。在使用Kafka时，需要注意消息的可靠性、偏移量和参数配置等问题。
复制链接

扫一扫