kafka生产者

最新推荐文章于 2024-10-10 07:30:00 发布

简丶致

最新推荐文章于 2024-10-10 07:30:00 发布

阅读量848

点赞数

分类专栏： kafka 大数据文章标签： kafka java

本文链接：https://blog.csdn.net/weixin_44825085/article/details/122802414

版权

大数据同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

kafka

2 篇文章 0 订阅

订阅专栏

本文详细介绍了如何使用Java编写Kafka生产者，包括配置bootstrap.servers、key.serializer和value.serializer参数，并提供了简化配置的方法。此外，还分析了消息发送的三种方式：发后即忘、同步和异步发送，解释了它们的工作原理和适用场景。

摘要由CSDN通过智能技术生成

kafka-生产者

1、生产者案例

使用Java程序编写kafka生产者

程序案例：

package cn.kafka.producer;
import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.ProducerRecord;
import java.util.Properties;

public class kafkaProducer {
    /**
     * 对kafka配置进行初始化
     * @return
     */
    public static Properties initConfig(){
        Properties properties = new Properties();

        // 配置kafka集群的Broker访问地址
        properties.put("bootstrap.servers","hadoop001:9092,hadoop002:9092");
        // 设置key和value的序列化方法，使用StringSerializer
        // 注意：这里必须使用全类名
        properties.put("key.serializer","org.apache.kafka.common.serialization.StringSerializer");
        properties.put("value.serializer","org.apache.kafka.common.serialization.StringSerializer");
        // 以上三个参数是必选参数，其他参数可按照实际情况配置
        return properties;
    }

    public static void main(String[] args){
        Properties pro = initConfig();

        // 创建kafka生产者
        KafkaProducer<String, String> kafkaProducer = new KafkaProducer<String, String>(pro);

        String topic = "log_topic";
        // 封装消息
        ProducerRecord<String, String> record = new ProducerRecord<String, String>(topic, "Hello world");
        // 发送消息
        kafkaProducer.send(record);
        // 关闭生产者
        kafkaProducer.close();
    }
}

上面是最简单的生产者案例。

2、配置分析

从上面的配置方法可以看出，我们需要配置bootstrap.server、key.serializer、value.serializer,这些参数名容易写错，因此有ProducerConfig类帮我们写好常量。

例如：

String servers = "hadoop001:9092,hadoop002:9092";
properties.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG,servers);

后面的全类名也容易出错，可以使用Class类获取Name

修改后的intiConfig方法：

public static Properties initConfigPro(){
    Properties properties = new Properties();

    String servers = "hadoop001:9092,hadoop002:9092";

    properties.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG,servers);
    
    properties.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, StringSerializer.class.getName());
    
    properties.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG,StringSerializer.class.getName());
    
    return properties;
}

修改后对于编写更加容易方便，只用记住大概的参数即可。

3、消息发送分析

发送消息前，我们需要将需要发送的信息封装到ProducerRecord类中，然后进行发送。

ProducerRecord类常用构造方法：

这里可以看出，我们不光可以发送value，还可以设置key，Header等。

消息发送的方式：发后即忘、同步、异步

发后即忘：

这种方式就是直接向kafka集群发送信息，不管信息是否能够发送成功。因此该种方式的速度最快，性能最后。但在有些场景（出现异常等）会造成数据丢失。

上面的案例程序就是同步发送。

同步发送：生产者对象使用send（）方法后会返回Future对象，利用Future对象的get方法检测发送结果。若发送成功，get方法可以获取RecordMetadata对象，里面存储消息的相关信息，若发送失败则会抛出异常。

// 发送消息
Future<RecordMetadata> future =  kafkaProducer.send(record);

try {
    RecordMetadata recordMetadata = future.get();
    // 返回各种元数据信息
    System.out.println(recordMetadata.offset());
} catch (InterruptedException e) {
    e.printStackTrace();
} catch (ExecutionException e) {
    e.printStackTrace();
}

异步发送：生产者调用send方法时，我们可以指定一个回调函数，服务器返回信息时会调用该方法，在回调方法里，我们可以判断消息的发送状况。

 producer.send(new ProducerRecord<String, Integer>("topictest", "hello kafka" + i, i)
                    , new Callback() {
                        public void onCompletion(RecordMetadata recordMetadata, Exception e) {
                            // 这里可以进行返回信息的判断，和后续操作。
                            if(e!=null){
                                e.printStackTrace();
                            }
                        }
                    })；