kafka入门（原理-搭建-简单使用）

最新推荐文章于 2024-06-22 09:58:06 发布

承诺不过儿戏

最新推荐文章于 2024-06-22 09:58:06 发布

阅读量119

点赞数

文章标签： kafka 分布式

原文链接：https://baijiahao.baidu.com/s?id=1679130339977853699&wfr=spider&for=pc

版权

kafka入门（原理-搭建-简单使用）

一、kafka介绍与原理

我们将消息的发布（publish）称作 producer，将消息的订阅（subscribe）表述为 consumer，将中间的存储阵列称作 broker(代理)，这样就可以大致描绘出这样一个场面：

生产者将数据生产出来，交给 broker 进行存储，消费者需要消费数据了，就从broker中去拿出数据来，然后完成一系列对数据的处理操作。

乍一看返也太简单了，不是说了它是分布式吗，难道把 producer、 broker 和 consumer 放在三台不同的机器上就算是分布式了吗。看 kafka 官方给出的图：

多个 broker 协同合作，producer 和 consumer 部署在各个业务逻辑中被频繁的调用，三者通过 zookeeper管理协调请求和转发。这样一个高性能的分布式消息发布订阅系统就完成了。

图上有个细节需要注意，producer 到 broker 的过程是 push，也就是有数据就推送到 broker，而 consumer 到 broker 的过程是 pull，是通过 consumer 主动去拉数据的，而不是 broker 把数据主懂发送到 consumer 端的。

二、kafka的linux基本搭建

此处还是给大家一个链接很是优秀！kafka的linux搭建

注意：kafka依赖于zookeeper的节点，需要搭建zookeeper，linux安装zookeeper文章中有链接（kafaka高版本也自带zookeeper，其实博主用kafka自带的zookeeper启动，然后启动kafka没成功，用安装的zookeeper就成功了…）

三、springboot整合kafka的简单demo

1.引入依赖

在springboot项目中的pom.xml引入下列依赖：

<dependency>

	<groupId>org.springframework.kafka</groupId>
	
	<artifactId>spring-kafka</artifactId>
	
	<version>2.2.6.RELEASE</version>

</dependency>

<dependency>

	<groupId>org.apache.kafka</groupId>
	
	<artifactId>kafka-clients</artifactId>
	
	<version>2.1.0</version>

</dependency>

<dependency>

	<groupId>org.projectlombok</groupId>
	
	<artifactId>lombok</artifactId>
	
	<optional>true</optional>

</dependency>

2.yml配置文件

配置如下：

server:
	port: 9192
spring:
	application:
		name: kafkatest
	#kafka配置
	kafka:
		bootstrap-servers: 192.168.200.130:9092 #此处是我虚拟机上linux的ip kafak的默认端口为9092
		producer: #生产者
			acks: 1
			client-id: kafka-producer
			batch-size: 5
			buffer-memory: 33554432
			key-serializer: org.apache.kafka.common.serialization.StringSerializer
			value-serializer: org.apache.kafka.common.serialization.StringSerializer
		consumer: #消费者
			group-id: hello-group
			enable-auto-commit: false
			auto-offset-reset: earliest
			key-deserializer: org.apache.kafka.common.serialization.StringDeserializer
			value-deserializer: org.apache.kafka.common.serialization.StringDeserializer
	#eureka注册中心配置
	eureka:
		  client:
		    service-url: #服务地址
		      defaultZone: http://localhost:8761/eureka
		    register-with-eureka: true #可以不往eureka-server注册
		    fetch-registry: true #应用是否去拉取服务列表到本地
		    registry-fetch-interval-seconds: 10 #为了缓解服务列表的脏读问题
		  instance:
		    hostname: localhost #应用的主机名称 最好写主机ip
		    instance-id: ${eureka.instance.hostname}:${spring.application.name}:${server.port}
		    prefer-ip-address: true #显示ip
		    lease-renewal-interval-in-seconds: 10 #实例续约的时间

是不是依赖没注释看不懂ennnnn，别急嘛，那我来搬运点详细的注释解释(我的demo就是上面的)

#============== kafka–producer ===================

指定kafka server的地址，集群配多个，中间，逗号隔开

spring.kafka.bootstrap-servers=127.0.0.1:9092

写入失败时，重试次数

spring.kafka.producer.retries=0

写入失败时，重试次数。当leader节点失效，一个repli节点会替代成为leader节点，此时可能出现写入失败，

当retris为0时，produce不会重复。retirs重发，此时repli节点完全成为leader节点，不会产生消息丢失。

每次批量发送消息的数量,produce积累到一定数据，一次发送

spring.kafka.producer.batch-size=16384

produce积累数据一次发送，缓存大小达到buffer.memory就发送数据

spring.kafka.producer.buffer-memory=33554432

procedure要求leader在考虑完成请求之前收到的确认数，用于控制发送记录在服务端的持久化，其值可以为如下：

acks = 0 如果设置为零，则生产者将不会等待来自服务器的任何确认，该记录将立即添加到套接字缓冲区并视为已发送。在这种情况下，无法保证服务器已收到记录，并且重试配置将不会生效（因为客户端通常不会知道任何故障），为每条记录返回的偏移量始终设置为-1。

acks = 1 这意味着leader会将记录写入其本地日志，但无需等待所有副本服务器的完全确认即可做出回应，在这种情况下，如果leader在确认记录后立即失败，但在将数据复制到所有的副本服务器之前，则记录将会丢失。

acks = all 这意味着leader将等待完整的同步副本集以确认记录，这保证了只要至少一个同步副本服务器仍然存活，记录就不会丢失，这是最强有力的保证，这相当于acks = -1的设置。

可以设置的值为：all, -1, 0, 1

spring.kafka.producer.acks=1

指定消息key和消息体的编解码方式

spring.kafka.producer.key-serializer=org.apache.kafka.common.serialization.StringSerializer

spring.kafka.producer.value-serializer=org.apache.kafka.common.serialization.StringSerializer

#=============== kafka–consumer =======================

指定默认消费者group id --> 由于在kafka中，同一组中的consumer不会读取到同一个消息，依靠groud.id设置组名

spring.kafka.consumer.group-id=testGroup

smallest和largest才有效，如果smallest重新0开始读取，如果是largest从logfile的offset读取。一般情况下我们都是设置smallest

spring.kafka.consumer.auto-offset-reset=earliest

#enable.auto.commit:true --> 设置自动提交offset

spring.kafka.consumer.enable-auto-commit=true

如果’enable.auto.commit’为true，则消费者偏移自动提交给Kafka的频率（以毫秒为单位），默认值为5000。

spring.kafka.consumer.auto-commit-interval=100

指定消息key和消息体的编解码方式

spring.kafka.consumer.key-deserializer=org.apache.kafka.common.serialization.StringDeserializer

spring.kafka.consumer.value-deserializer=org.apache.kafka.common.serialization.StringDeserializer

3.Controller

import lombok.AllArgsConstructor;
import org.springframework.kafka.core.KafkaTemplate;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.PathVariable;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;

@RestController
@AllArgsConstructor
@RequestMapping("Kafka")

public class SimpleController {

	private final KafkaTemplate<Object,Object> kafkaTemplate;
	
	@GetMapping("/send/{message}")
	public String send(@PathVariable("message") String message){
		kafkaTemplate.send("topic1","topic1:"+message);
		kafkaTemplate.send("topic2","topic2:"+message);
		return message;
	}
}

4.Listener

import org.springframework.kafka.annotation.KafkaListener;
import org.springframework.stereotype.Component;
	
@Component
public class SimpleListener {
	@KafkaListener(topics = {"topic1","topic2"})
	public void listen1(String data){
		System.out.println(data);
	}
}

5.访问

在这里插入图片描述

6.结果

控制台输出：
在这里插入图片描述

四，搭建的坑

我搭建使用的是虚拟机上的linux所以要么开放kafka端口要么关闭防火墙如果不开放项目启动的时候报错：

Connection to node 1 (localhost/127.0.0.1:9092) could not be established. Broker may not be available.

承诺不过儿戏

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
kafka入门（原理-搭建-简单使用）

我们将消息的发布（publish）称作 producer，将消息的订阅（subscribe）表述为 consumer，将中间的存储阵列称作 broker(代理)，这样就可以大致描绘出这样一个场面：生产者将数据生产出来，交给 broker 进行存储，消费者需要消费数据了，就从broker中去拿出数据来，然后完成一系列对数据的处理操作。乍一看返也太简单了，不是说了它是分布式吗，难道把 producer、 broker 和 consumer 放在三台不同的机器上就算是分布式了吗。
复制链接

扫一扫