Kafka

最新推荐文章于 2023-08-25 10:23:40 发布

yuell102

最新推荐文章于 2023-08-25 10:23:40 发布

阅读量633

点赞数 1

文章标签： kafka docker

本文链接：https://blog.csdn.net/yuell102/article/details/119566997

版权

文章目录

模型图
单机
demo

模型图

单机

安装JDK

https://blog.csdn.net/yuell102/article/details/119305484?spm=1001.2014.3001.5501

安装Docker

https://blog.csdn.net/yuell102/article/details/116572748

安装

docker 安装 zookeeper

docker pull wurstmeister/zookeeper

docker 安装 kafka

docker pull wurstmeister/kafka

单机方式启动zookeeper

docker run -d --name zookeeper --restart=always -p 2181:2181 -t wurstmeister/zookeeper

单机方式启动kafka

docker run -d --name kafka --restart=always -p 9092:9092 -e KAFKA_BROKER_ID=0 -e KAFKA_ZOOKEEPER_CONNECT=10.0.0.101:2181 -e KAFKA_ADVERTISED_LISTENERS=PLAINTEXT://10.0.0.101:9092 -e KAFKA_LISTENERS=PLAINTEXT://0.0.0.0:9092 wurstmeister/kafka

//docker run -d --name kafka
//--restart=always 
//-p 9092:9092
//-e KAFKA_BROKER_ID=0 
//-e KAFKA_ZOOKEEPER_CONNECT=公网ip:2181
//-e KAFKA_ADVERTISED_LISTENERS=PLAINTEXT://公网ip:9092 
//-e KAFKA_LISTENERS=PLAINTEXT://0.0.0.0:9092 wurstmeister/kafka

Kafdrop

创建目录

sudo mkdir -p /home/kafdrop

创建并编辑docker-compose-kafdrop.yaml

sudo vi /home/kafdrop/docker-compose-kafdrop.yaml

写入内容

version: "3"
services:
  kafdrop:
    image: obsidiandynamics/kafdrop
    restart: "no"
    ports:
      - "9000:9000"
    environment:
      KAFKA_BROKERCONNECT: "外网ip:9092"

安装并启动

docker-compose -f /home/kafdrop/docker-compose-kafdrop.yaml up -d

访问 ip:9000
在这里插入图片描述

demo

Topic管理

TopicDetailed

创建as Topic 3个分区 1个复制因子默认异步

adminClient.createTopics(Arrays.asList(new NewTopic("ac", 3, (short) 1)));

删除as Topic 默认异步

adminClient.deleteTopics(Arrays.asList("ac"));

返回 Topic列表名称默认异步

ListTopicsResult listTopicsResult = adminClient.listTopics();
Set<String> names = listTopicsResult.names().get();

删除 Topic 默认异步

describeTopics(Arrays.asList("ac"));

使其同步，等待执行完回来，返回结果

xx.all().get();

简单生产者/消费者

生产者

ProducerQuickStart

推送给分区消息有key走的时hash

new ProducerRecord<>("ac", "key" + i, "value" + i);

推送消息无key走的是其他策略（不一定是轮询轮询策略）

new ProducerRecord<>("ac", "value" + i);

//推送消息指定分区推送指定1分区

new ProducerRecord<>("ac", 1, "key" + i, "value" + i);

消费者

ConsumerAssign 不配置消费组id 手动指定Topic分区手动指定偏移量起始位值offset

1.assign手动指定消费分区失去自动负载均衡
2.不能指定消费者组properties.put(ConsumerConfig.GROUP_ID_CONFIG, “c2”);

consumer.assign(topicPartitions);

3.指定消费偏移量 offset
指定消费位置从头消费从offset=0开始消费

consumer.seekToBeginning(topicPartitions);

指定消费位置 1分区从offset=5开始消费

consumer.seek(new TopicPartition("ac", 1), 5);

从offset=当前最大开始消费

consumer.seekToEnd(topicPartitions);

ConsumerSubscribe 配置消费组id 自动负载管理Topic分区无需指定偏移量offset

1.指定消费者分组id

properties.put(ConsumerConfig.GROUP_ID_CONFIG, "c2");

2.订阅相关得Topics
一个topic多个分区时一个消费组多个消费者时 subscribe订阅自动负载均衡

consumer.subscribe(Pattern.compile("^ac.*"));

自定义分区 partitioner

MyPartitioner

1.需要继承org.apache.kafka.clients.producer.Partitioner

2.重写或实现函数，可以参考org.apache.kafka.clients.producer.DefaultPartitioner

3.根据自己需求生产者配置，根据实现算法发送消息到期望的分区

4.配置自定义分区策略

properties.put(ProducerConfig.PARTITIONER_CLASS_CONFIG, MyPartitioner.class.getName());

目前一直分区

认分区策略：
如果记录中指定了分区，则使用它
如果未指定分区但存在键，则根据键的散列选择一个分区
如果不存在分区或键，请选择在批处理已满时更改的粘性分区。 有关粘性分区的详细信息，请参阅 KIP-480。
DefaultPartitioner


“循环”分区器 当用户希望将写入平均分配到所有分区时，可以使用此分区策略。 这是与记录键哈希无关的行为
RoundRobinPartitioner

分区策略：
如果记录中指定了分区，则使用它
否则选择当批处理已满时更改的粘性分区。 注意：与 DefaultPartitioner 相比，记录键不用作此分区器中分区策略的一部分。 不保证具有相同键的记录被发送到同一个分区。 有关粘性分区的详细信息，请参阅 KIP-480。
UniformStickyPartitioner

序列化

MySerializer 序列化

1.实现接口org.apache.kafka.common.serialization.Serializer

2.生产者需要增加

//key传递序列化规则
properties.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, MySerializer.class.getName());
//value传递序列化规则
properties.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG, MySerializer.class.getName());

MyDeserializer 反序列化

1.实现接口org.apache.kafka.common.serialization.Deserializer

2.消费者需要增加

//key传递反序列化规则
properties.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, MyDeserializer.class.getName());
//value传递反序列化规则
properties.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, MyDeserializer.class.getName());

拦截器

MyProducerInterceptor

1.需要实现接口：com.kafka.kafka_demo.interceptors.ProducerInterceptor

2.生产者需要增加

//自定义拦截器
properties.put(ProducerConfig.INTERCEPTOR_CLASSES_CONFIG, MyProducerInterceptor.class.getName());

offset自动控制

//默认 在消费者没有偏移量offset时生效
auto.offset.reset=latest
earliest:自动将偏移量重置为最早的偏移量
latest:自动将偏移量重置为最新的偏移量
none:如果未找到消费者组的先前偏移量,则消费者抛出异常

//默认 自动提交偏移量
enable.auto.commit=true

ConsumerSubscribeOffSet 手动提交偏移量

1.关闭提交自动会导致偏移量一直停留在已消费过的消息上面

properties.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, false);

2.手动提交偏移量偏移量一定要增加

 //消息的偏移量
long offset = next.offset();

//这里必须++  每次重启都会导致最后一个消息重复消费
long count = ++offset;

//手动提交offset
Map<TopicPartition, OffsetAndMetadata> offsets=new HashMap<TopicPartition, OffsetAndMetadata>();

offsets.put(new TopicPartition(next.topic(), partition),new OffsetAndMetadata(count));
consumer.commitAsync(offsets, new OffsetCommitCallback() {
    @Override
    public void onComplete(Map<TopicPartition, OffsetAndMetadata> offsets, Exception exception) {
        System.out.println("完成："+count+"提交！");
    }
});

ConsumerSubscribeOffSetDelay 延迟提交偏移量

1.自动提交offset 默认为true

properties.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, true);

2.自动提交时生效 offset 偏移量提交频次 10000毫秒提交一次提交前，每次打开都会消费没提交的消息 10秒内重起会重复消费

properties.put(ConsumerConfig.AUTO_COMMIT_INTERVAL_MS_CONFIG, 10000);

应答与重发（Acks&Retries）与幂等

ProducerAcks概括

//Kafka生成这在发送完一个消息之后，要求Broker在规定的时间Ack应答，如果规定时间内没有应答，Kafka生产这会尝试N次重新发送消息

//acks=1   只要Leader确认
//Leader 会将Record写到其本地日志中，但会在不等待所有Follower的完全确认情况下做出响应，在这种情况下，如果Leader在确认记录后立即失败，但Follower复制记录之前失败，则记录将丢失

//acks=0   不需要任何确认
//生产者根本不会等待服务器的任何确认。该记录将立即添加到套接字缓存区中并视为已发送。这种情况下，不能保证服务器已收到记录

//acks=all   acks=-1  需要Leader和至少一个副本确认
//Leader将等待全套同步副本确认记录。这保证只要至少一个同步副本仍处于活动那个状态，记录不会丢失，这是最有力的保证

//request.timeout.ms=30000 默认ack超时时间  如果30秒未收到确认重发
//retries=2147483647 默认重试次数

图画的有点问题，仅供参考acks=1

图画的有点问题，仅供参考acks=0

图画的有点问题，仅供参考acks=all | acks=-1

ProducerAcks 生产者配置

1.设置应答模式需要Leader和至少一个副本确认

properties.put(ProducerConfig.ACKS_CONFIG, "all");

2.重发次数3次如果超过3次也失败,则系统放弃发送

properties.put(ProducerConfig.RETRIES_CONFIG, 3);

3.将检测超时的时间设置为1毫秒

properties.put(ProducerConfig.REQUEST_TIMEOUT_MS_CONFIG, 1);

ProducerAcksIdempotent 幂等生产者配置 //设置应答模式需要Leader和至少一个副本确认

1.必须配置为 all 保证Leader和至少一个副本确认都确认收到消息

properties.put(ProducerConfig.ACKS_CONFIG, "all");

2.必须设置重发次数这里设置的是3

properties.put(ProducerConfig.RETRIES_CONFIG, 3);

3.开启Kafka的幂等性

properties.put(ProducerConfig.ENABLE_IDEMPOTENCE_CONFIG, true);

4.必须设置为1 才能保证顺序限制客户端在单个连接上能够发送的未响应请求的个数。设置此值是1表示kafka broker在响应请求之前client不能再向同一个broker发送请求。注意：设置此参数是为了避免消息乱序

properties.put(ProducerConfig.MAX_IN_FLIGHT_REQUESTS_PER_CONNECTION, 1);

事务

//Kafka的幂等，只能保证一条记录在分区发送的原子性
//多条记录多分区之间的完整性，需要开启kafka的事务操作

事务种类图

flowchart LR
subgraph 消费者&生产者事务;
	subgraph Topic1;
		subgraph 分区3[分区0:Leader];
		end
		subgraph 分区4[分区1:Follower];
		end
		subgraph 分区5[分区2:Follower];
		end
	end
	分区3 -->|推送消息|消费者0;
	分区4 -->|推送消息|消费者0;
	分区5 -->|推送消息|消费者0;
	subgraph 业务;
		subgraph 消费者0;
		end
	end
	
	消费者0 -->|推送消息|分区6;
	消费者0 -->|推送消息|分区7;
	消费者0 -->|推送消息|分区8;
	subgraph Topic2;
		subgraph 分区6[分区0:Leader];
		end
		subgraph 分区7[分区1:Follower];
		end
		subgraph 分区8[分区2:Follower];
		end
	end
end

事务隔离级别

isolation.level = read_uncommitted; //默认 事务读未提交   可以读到未提交事务的数据

isolation.level = read_committed; //事务读已提交   可以读到已提交事务的数据，未提交的读不到

生产者事务Only

读未提交ConsumerSubscribeReadUnCommitted

//消费事务的隔离级别read_committed 读未提交

properties.put(ConsumerConfig.ISOLATION_LEVEL_CONFIG, "read_uncommitted");

读已提交ConsumerSubscribeReadCommitted

//消费事务的隔离级别read_committed 读已提交

properties.put(ConsumerConfig.ISOLATION_LEVEL_CONFIG, "read_committed");

生产者ProducerT

//设置事务id  id必须唯一
properties.put(ProducerConfig.TRANSACTIONAL_ID_CONFIG, "transaction-id" + UUID.randomUUID().toString());
//配置Kafka批处理大小
properties.put(ProducerConfig.BATCH_SIZE_CONFIG, 1024);
//等待5ms  如果batch中数据不足 1024大小
properties.put(ProducerConfig.LINGER_MS_CONFIG, 5);

//配置Kafka重试机制和幂等性
properties.put(ProducerConfig.ENABLE_IDEMPOTENCE_CONFIG, true);
properties.put(ProducerConfig.ACKS_CONFIG, "all");
properties.put(ProducerConfig.REQUEST_TIMEOUT_MS_CONFIG, 20000);

消费者&生产者事务

//需要关闭第一个消费者的offset自动提交偏移量 手动+1维护偏移量

SpringBoot 集成

消费者

singleListenner 普通消费者

/**
     * 监听 aa Topic
     * @param value
     */
    @KafkaListeners(value = {@KafkaListener(topics = {"aa"})})
    public void singleListenner(ConsumerRecord<?, ?> value) {
        log.info(value.value().toString());
    }

listenner 接收处理后发送给其他Topic

/**
     * 接受 aa Topic 处理后发送给 bb Topic
     * @param value
     * @return
     */
    @KafkaListeners(value = {@KafkaListener(topics = {"aa"})})
    @SendTo(value = {"topic05"})
    public String listenner(ConsumerRecord<?, ?> value) {

        return value.value()+"我从aa处理后过来的！";
    }

生产者

非事务发送

    /**
     *  非事物发送
     *   配 transaction-id-prefix 会报错
     */
    @Test
    public void testNotTransaction(){
        kafkaTemplate.send(new ProducerRecord("aa","003","非事务消息"));
    }

事务发送

 /**
     *  kafka事物发送
     */
    @Test
    public void testKafkaTemplate(){
        kafkaTemplate.executeInTransaction(new KafkaOperations.OperationsCallback() {
            @Override
            public Object doInOperations(KafkaOperations kafkaOperations) {
                return kafkaOperations.send(new ProducerRecord("aa","002","发送Kafka事务"));
            }
        });
    }

利用Spring事物发送kafka事物

@Resource
    private OrderService orderService;


    /**
     *  利用Spring事物 发送kafka事物
     */
    @Test
    public void testOrderService(){
        orderService.saveOrder("001","利用Spring事物 发送kafka事物");
    }

yuell102

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Kafka

文章目录单机安装单机安装docker 安装 zookeeperdocker pull wurstmeister/zookeeperdocker 安装 kafkadocker pull wurstmeister/kafka单机方式启动docker run -d --name zookeeper -p 2181:2181 -t wurstmeister/zookeeper
复制链接

扫一扫