关于Kakfa

最新推荐文章于 2024-10-16 09:19:27 发布

chenlanqi3579

最新推荐文章于 2024-10-16 09:19:27 发布

阅读量85

点赞数

文章标签：大数据

原文链接：https://my.oschina.net/sofly/blog/3078741

版权

kafka是一种分布式的、基于发布/订阅的消息系统

1、kafka队列为什么吞吐量大

a、生产消息时kafka是顺序写入硬盘

b、Kafka的数据并不是实时的写入硬盘而是使用内存映射文件技术（mmap）

Kafka提供了一个参数——producer.type来控制是不是主动flush 即同步和异步

c、消费者消费消息时读取数据的时候是以文件的方式零拷贝从内核空间直接输入到端口上

d、Kafaka消息存储是基于partiton，可以横行扩展

2、kafaka Broker Server

leader选举

防止kafka丢消息

1、生产端使用同步发送、设置required.acks属性为-1（主从同时确认）

0：不确认，1：主确认

2、设置消息ID保证消息不重复

3、消费端设置delivery属性为at least one 至少消费一次

先消费再确认。通过业务主键保证幂等

转载于:https://my.oschina.net/sofly/blog/3078741

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

chenlanqi3579

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Kafka 练习题

DH15145070414的博客

04-30

7603

一、选择题 Kafka服务器默认能接收的最大消息是多大? （单选） A 　　　　A：1M 　　　　B：10M 　　　　C：100M 　　　　D：没有大小限制，因为支持大数据 　　2.Kafka的特性（多选） ABCD 　　　　A：高吞吐量、低延迟　　　　B：可扩展性、持久性、可靠性　　　　C：容错性　　　　D：高并发　　3.kaf...

关于kafka重新消费数据问题

duke_pan的博客

04-22

3679

关于kafka重新消费数据问题我们在使用consumer消费数据时，有些情况下我们需要对已经消费过的kafka数据进行重新消费，这里介绍kafka中重新消费数据的方法。 1、重新使用新的消费组通过不同的group来重新消费数据方法简单，但我们无法指定我们要重复消费哪些数据。这里需要注意的是新的group是重新消费所有数据，但也并非是topic中所有数据，它只会消费topic下现在存在的数据。 2、修改offset偏移量我们在使用consumer消费的时候，每个topic会产生一个偏移量，这个偏移量保证

参与评论您还未登录，请先登录后发表或查看评论

关于kafka的ack机制

zhouxiaozxx的博客

09-30

7471

Kafka的ack机制，指的是producer的消息发送确认机制 acks有3个值可选 0、1和-1（或者all），默认值为1，值为字符串类型，不是整数类型 0：producer发送后即为成功，无需分区partition的leader写入成功 1：producer发送后需要接收到partition的leader发送确认收到的回复 -1：producer发送后，需要ISR中所有副本都成功写入成功才能收到成功响应 ...

【Kafka】关于Kafka启动时报错的解决过程

cnskylee的博客

03-17

1万+

版本信息： kafka_2.12-3.1.0、apache-zookeeper-3.8.0 报错信息： [2022-03-16 05:30:57,192] WARN An exception was thrown while closing send thread for session 0x100007216820000. (org.apache.zookeeper.ClientCnxn) EndOfStreamException: Unable to read additional data f

关于kafka连接超时的解决思路

weixin_60909815的博客

11-14

6582

kafka启动出现超时的一种解决思路

关于Kafka的那些坑

王奇的博客

02-02

6998

进来使用了Kafka消息队列，喜忧参半。细数一下，踩过的坑。 1、最好不要用Windows服务器去搞，当然像本人这样被迫使用的，就硬着头皮搞。 Windows服务器搭建Kafka，首先先例少。其次稳定性，个人感觉要比Linux或者Mac上差远了。Windows上，停止Kafka后，在启动需要删掉log。否则会报错，log正在被另一个进程访问。Mac运行则没发现同样错误。 2、Kafka的

关于kafka的配置acks和min.insync.replicas详解，通俗易懂一看就会

DraGon_HooRay的博客

03-28

1万+

acks 描述：producer 发送数据服务端的响应级别 acks = all/-1 : 表示kafka isr列表中所有的副本同步数据成功，才返回消息给客户端 acks = 0 ：表示客户端只管发送数据，不管服务端接收数据的任何情况 acks = 1 ：表示客户端发送数据后，需要在服务端 leader 副本写入数据成功后，返回响应 min.insync.replicas 描述：Kafka ISR 列表中最小同步副本数默认 min.insync.replicas = 1 当 acks = all

关于kafka集群出现异常，无法选取topics分区领导问题

沉心ss的博客

11-04

1万+

1.基础环境 ubuntu系统 4台物理机 4个kafka节点 3个zookeeper节点节点全部都在docker容器环境运行主要是接手的Farbic1.4的kafka共识orderer节点，挖的坑哎 2.问题日志 kafka报错日志 [2021-11-03 02:59:56,910] INFO [ReplicaFetcher replicaId=1, leaderId=4, fetcherId=0] Retrying leaderEpoch request for part

关于kafka消费者超时配置

不爱运动的跑者

06-07

7188

1. 在 Spring Boot 的配置文件（如 `application.properties` 或 `application.yml`）中添加 Kafka 消费者相关的配置项。在上述示例中，`spring.kafka.consumer.properties.max.poll.interval.ms` 设置了消费者的最大轮询间隔时间为 5000 毫秒（即 5 秒）。2. 创建 Kafka 消费者的配置类，用于自定义消费者的属性。在Kafka中，消费者超时配置是指消费者在等待服务器响应时的超时时间。

Spring Kafka中关于Kafka的配置参数

热门推荐

冯立彬的博客

08-27

7万+

SpringKafka文档地址：https://docs.spring.io/spring-kafka/reference/htmlsingle kafka文档地址：http://kafka.apache.org/documentation SpringKafka中配置的Java配置实现类：https://github.com/spring-projects/spring-boot/blob/v1...

python kafka offset自动提交_关于Kafka 的 consumer 消费者手动提交详解

weixin_39837124的博客

12-19

1732

前言在上一篇 Kafka使用Java实现数据的生产和消费demo 中介绍如何简单的使用kafka进行数据传输。本篇则重点介绍kafka中的 consumer 消费者的讲解。应用场景在上一篇kafka的consumer消费者，我们使用的是自动提交offset下标。但是offset下标自动提交其实在很多场景都不适用，因为自动提交是在kafka拉取到数据之后就直接提交，这样很容易丢失数据，尤其是在需要事...

关于kafka的Cannot assign requested address

weixin_37761111的博客

12-01

1025

云主机配置kafka启动失败报错如图定位后发现使用的是云主机，有内网IP和外网IP，虚拟机对外ip[暴露的ip]和真实ip[ifconfig显示的ip]可能只是映射关系，用户访问对外ip时，OpenStack会转发到对应的真实ip实现访问。但此时如果 Kafka server.properties配置中的listeners=PLAINTEXT://对外IP:9092中的ip配置为[对外ip]的时候无法启动，因为socket无法绑定监听；先查看内网IP：在kafka的server.properti

关于kafka中的反序列化

Lestat.Z.的博客

05-12

3712

Deserializers前言Custom deserializers使用Avro反序列化与Kafka消费者参考资料前言 Kafka生产者需要序列化程序将对象转换为字节数组，然后发送到Kafka。同样，Kafka消费者需要使用反序列化器将从Kafka收到的字节数组转换为Java对象。在前面的示例中，我们假设每个消息的键和值都是字符串，我们在消费者配置中使用了默认的StringDeserial...

spring cloud stream中关于kafka生产消费大数据量的配置问题

CTPeng的博客

04-20

2310

spring cloud stream中关于kafka生产消费大数据量的配置问题1 基础了解2 配置步骤3 配置详情3.1 生产者（应用程序A）3.2 消费者（应用程序B）3.3 broker（leader）4 最后请关注一下源码 1 基础了解 producer:生产者，Spring Cloud Stream kafka应用程序 broker: kafka服务 consumer:消费者，Spri...

020 elasticsearch7.10.2 elasticsearch-head kibana安装

m0_46695127的博客

10-13

843

020 elasticsearch7.10.2 elasticsearch-head kibana安装

SparkSQL介绍及使用

m0_70882914的博客

10-13

490

SparkSQL介绍及使用

大数据治理：挑战与实践

weidl001的博客

10-13

1202

大数据治理是现代企业在数据管理过程中必须面对的挑战，通过科学有效的治理策略和先进的工具，企业可以有效地提升数据质量、增强数据安全、满足合规要求，并最大化数据的业务价值。随着大数据技术和AI的进步，大数据治理的自动化和智能化将为企业提供更强的竞争力。持续投入和关注数据治理，将有助于企业在复杂的数据环境中把握先机、实现创新。

大数据与人工智能在金融风险控制中的应用