Kafka API

最新推荐文章于 2022-05-26 23:11:41 发布

程序员学习圈

最新推荐文章于 2022-05-26 23:11:41 发布

阅读量429

点赞数

分类专栏： # Kafka

本文链接：https://blog.csdn.net/Luomingkui1109/article/details/82784554

版权

Kafka 专栏收录该内容

17 篇文章 1 订阅

订阅专栏

1.环境准备

(1) 在eclipse中创建一个java工程

(2) 在工程的根目录创建一个lib文件夹

(3) 解压kafka安装包

将安装包libs目录下的jar包拷贝到工程的lib目录下，并build path。

(4) 启动zk和kafka集群，在kafka集群中打开一个消费者

[luomk@hadoop102 kafka]$ bin/kafka-console-consumer.sh -zookeeper hadoop102:2181 --topic first --consumer.config config/consumer.properties

2. 创建生产者带回调函数（新API）

/**

* 案例1：创建生产者

*

*/

public class NewProduct {



    public static void main(String[] args) {



        Properties props = new Properties();

        // Kafka服务端的主机名和端口号

        props.put("bootstrap.servers", "hadoop102:9092");

        // 等待所有副本节点的应答

        props.put("acks", "all");

        // 消息发送最大尝试次数

        props.put("retries", 0);

        // 一批消息处理大小

        props.put("batch.size", 16384);

        // 请求延时

        props.put("linger.ms", 1);

        // 发送缓存区内存大小

        props.put("buffer.memory", 33554432);

        // key序列化

        props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        // value序列化

        props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");





        KafkaProducer<String, String> producer = new KafkaProducer<String, String>(props);

        for (int i = 0; i < 10; i++) {

            producer.send(new ProducerRecord<String, String>("first", Integer.toString(i), "luomk hello world-" + i));



            System.out.println(new ProducerRecord<String, String>("first", Integer.toString(i), "luomk hello world-" + i));

        }



        producer.close();

    }

}

在服务器端的效果：

3.自定义分区生产者

(1) 需求:将所有数据存储到topic的第0号分区上

(2) 定义一个类实现Partitioner接口，重写里面的方法

/**

* 案例二：自定义分区

*/

public class CustomPartitioner implements Partitioner{

    public int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster) {

        //控制分区

        return 0;

    }

    public void close() {

    }



    public void configure(Map<String, ?> configs) {

    }

}

(3) 在代码中调用

/**

* 案例二：自定义分区（生产者）

*/

public class PartitionerProducer {

    public static void main(String[] args) {

        Properties props = new Properties();

        // Kafka服务端的主机名和端口号

        props.put("bootstrap.servers", "hadoop102:9092");

        // 等待所有副本节点的应答

        props.put("acks", "all");

        // 消息发送最大尝试次数

        props.put("retries", 0);

        // 一批消息处理大小

        props.put("batch.size", 16384);

        // 请求延时

        props.put("linger.ms", 1);

        // 发送缓存区内存大小

        props.put("buffer.memory", 33554432);

        // key序列化

        props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        // value序列化

        props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        // 自定义分区

        props.put("partitioner.class", "com.atguigu.kafka.CustomPartitioner");

        KafkaProducer<String, String> producer = new KafkaProducer<String, String>(props);

        producer.send(new ProducerRecord<String, String>("first", "我就是key1", "我就是values1"));

        producer.close();

    }

}

(4) 测试

① 在hadoop102上监控/opt/module/kafka/logs/目录下first主题3个分区的log日志动态变化情况

[luomk@hadoop102 first-0]$ tail -f 00000000000000000000.log

[luomk@hadoop102 first-1]$ tail -f 00000000000000000000.log

[luomk@hadoop102 first-2]$ tail -f 00000000000000000000.log

② 发现数据都存储到指定的分区了。

4.Kafka消费者Java API

(1) 在控制台创建发送者

[luomk@hadoop102 kafka]$ bin/kafka-console-producer.sh --broker-list hadoop102:9092 --topic first

>luomk

>kafka

(2) 创建消费者(官方提供案例(自动维护消费情况-新API))

/**

* 案例三：自动维护消费情况的API

*/

public class CustomNewConsumer {



    public static void main(String[] args) {



        Properties props = new Properties();



        // 定义kakfa 服务的地址，不需要将所有broker指定上

        props.put("bootstrap.servers", "hadoop102:9092");

        //制定consumer group

        props.put("group.id", "test");

        // 是否自动提交offset

        props.put("enable.auto.commit", "true");

        //自动确认offset时间间隔

        props.put("auto.commit.interval.ms", "1000");

        //key的序列化类

        props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

        //values的序列化类

        props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");



        KafkaConsumer<String, String> consumer = new KafkaConsumer<String, String>(props);

        consumer.subscribe(Arrays.asList("first", "second", "three"));



        while (true) {

            ConsumerRecords<String, String> records = consumer.poll(100);

            for (ConsumerRecord<String, String> record : records)

                System.out.printf("record.offset():" + record.offset() + ",record.key():" + record.key() + "record.value():" + record.value()+"\t");

        }

    }

}

5.源码地址：https://github.com/luomingkui/kafka

程序员学习圈

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
Kafka API

1.Kafka分区分配策略在 Kafka 内部存在两种默认的分区分配策略:Range 和 RoundRobin。当以下事件发生时，Kafka 将会进行一次分区分配: 同一个 Consumer Group 内新增消费者消费者离开当前所属的 Consumer Group，包括 shuts down 或 crashes 订阅的主...
复制链接

扫一扫