Kafka高并发实现

最新推荐文章于 2023-10-23 21:28:20 发布

民工七号

最新推荐文章于 2023-10-23 21:28:20 发布

阅读量1.4k

点赞数

本文链接：https://blog.csdn.net/weixin_38401971/article/details/105764807

版权

Kafka是高吞吐低延迟的高并发、高性能的消息中间件，在大数据领域有极为广泛的运用。配置良好的Kafka集群甚至可以做到每秒几十万、上百万的超高并发写入。

在读和写的过程中主要用到三个技术：
1.页缓存技术
linux操作系统本身有一层缓存，叫做 Page Cache，是在内存里的缓存，我们也可以称之为 OS Cache，意思就是操作系统自己管理的缓存。

Kafka在写入磁盘文件的时候，可以直接写入这个 OS Cache 里，也就是仅仅写入内存中，接下来由操作系统自己决定什么时候把 OS Cache 里的数据真的刷入磁盘文件中。写入内存相对于直接写入磁盘效率大大提高。

2.磁盘的顺序写
kafka写数据的时候，他是以磁盘顺序写的方式来写的。也就是说，仅仅将数据追加到文件的末尾，不是在文件的随机位置来修改数据。
这种磁盘顺序写的性能基本上可以跟写内存的性能本身也是差不多的。

基于上面两点，Kafka 就实现了写入数据的超高性能。

3.零拷贝技术

这个技术主要是应用在数据的读的时候。如果kafka的数据在内存中，是用不到这种技术的，在读数据的时候直接从内存中拿就可以了。
如果数据在磁盘中，就需要先拿到内存中，再到kafka的消费者中。使用这种技术就直接在内存中，把数据的文件符拷贝到sorket中，直接给消费者就可以了。

这样就实现了Kafka读数据的高性能。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

民工七号

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Kafka高可用，高吞吐量低延迟的高并发的特性背后实现机制

代码界的扛把子

03-30

608

1 概述 Kafka是最初由Linkedin公司开发，是一个分布式、分区的、多副本的、多订阅者，基于zookeeper协调的分布式消息系统，Linkedin于2010年贡献给了Apache基金会并成为顶级开源项目。 2 消息系统介绍一个消息系统负责将数据从一个应用传递到另外一个应用，应用只需关注于数据，无需关注数据在两个或多个应用间是如何传递的。分布式消息传递基于可靠的消息队列，在客户端应用和消息系统之间异步传递消息。有两种主要的消息传递模式：点对点传递模式、发布-订阅模式。大部分的消息系统选用发布

kafka在高并发场景下的解决方案

小超人的专栏

04-18

2481

案例描述在我们想在开发的项目中，经常会用到kafka消息中间件。一般情况下，单线程（单分区）的配置已经可以满足需求，但是在某些大数据和数据并发量要求较高的应用场景下经常会遇到消息来不及处理，出现消息积压的情况。因此，该文章主要针对这种应用场景提供了一个多线程消费的解决方案案例分析自己在平时使用kafka消息中间件的时候开始也并没有分区的概念，都是像传统的MQ消息中间件一样，直接从TOPIC里...

参与评论您还未登录，请先登录后发表或查看评论

面试官：消息中间件如何实现每秒几十万的高并发写入？【石杉的架构笔记】...

石杉的架构笔记

03-04

3606

点击上方"蓝字",右上角选择“设为星标”周一至周五早8点半！精品技术文章准时送上！公众号后台回复 “学习” ，获取作者独家秘制学习套餐目录1、页缓存技术 +...

Kafka是如何实现几十万的高并发写入

专注于后端开发，时常接触大数据、人工智能等

09-29

589

开篇在初识kafka 一文中讲了使用MQ(消息队列)来设计系统带来的好处：业务解耦、流量削峰、灵活扩展当下流行的MQ有很多，因为我们公司在技术选型上选择了使用Kafka，所以我就整理了一篇关于Kafka的入门知识。通过技术选型我们对业界主流的MQ进行了对比，Kakfa最大的优点就是吞吐量高。 Kafka是高吞吐低延迟的高并发、高性能的消息中间件，在大数据领域有极为广泛的...

Kafka如何实现每秒上百万的高并发写入？

wang_nian的博客

10-10

471

Kafka是高吞吐低延迟的高并发、高性能的消息中间件，在大数据领域有极为广泛的运用。配置良好的Kafka集群甚至可以做到每秒几十万、上百万的超高并发写入。那么Kafka到底是如何做到这么高的吞吐量和性能的呢？这篇文章我们来一点一点说一下。一、页缓存技术 + 磁盘顺序写首先Kafka每次接收到数据都会往磁盘上去写，如下图所示：那么在这里我们不禁有一个疑问了，如果把数据基于磁盘来存储，频繁的往磁盘文件里写数据，这个性能会不会很差？大家肯定都觉得磁盘写性能是极差的。没错，...

高并发高可用之Kafka

Ycy的博客

07-23

1185

消息的消费者的消费速度，远赶不上生产者的生产消息的速度，导致kafka中有大量的数据没有被消费。随着没有被消费的数据堆积越多，消费者寻址的性能会越来越差，最后导致整个kafka对外提供的服务的性能很差，从而造成其他服务也访问速度变慢，造成服务雪崩。HW是已完成同步的位置。但是有个问题，如果说这个topic中的消息非常多，多到需要几个T来存，因为消息是保存在log日志文件中的，为了解决这个问题，kafka给出分区解决。–创建多个消费组，多个消费者，部署到其他机器上，一起消费，提高消费者的消费速度。...

图解 Kafka 超高并发网络架构演进过程

m0_67322837的博客

08-19

348

要想理解 Kafka Broker 请求处理架构设计，我们需要从简单请求处理模型来说起。对于日常系统开发，我们都知道是基于 Request/Response 的模式来实现的，对于 Kafka 来说，无论是 Producer 端、Consumer 端还是 Broker 端，他们之间的请求交互也都是基于「」模式来完成的。比如，客户端会通过网络发送消息生产请求给 Broker，而 Broker 处理完成后，会发送对应的响应给到客户端。

Kafka 高并发原理

weixin_38138332的博客

08-06

888

Kafka是高吞吐低延迟的高并发、高性能的消息中间件，在大数据领域有极为广泛的运用。配置良好的Kafka集群甚至可以做到每秒几十万、上百万的超高并发写入。那么Kafka到底是如何做到这么高的吞吐量和性能的呢？ 1、页缓存技术 + 磁盘顺序写首先Kafka每次接收到数据都会往磁盘上去写，如下图所示。那么在这里我们不禁有一个疑问了，如果把数据基于磁盘来存储，频繁的往磁盘文件里写数据，这个性能会...

Kafka实现高并发的原理（消息中间件如何实现每秒几十万的高并发写入）

小凯的博客

08-07

3026

Kafka: 是一个高吞吐低延迟的高并发，高性能消息中间件。配置良好的Kafka集群能够做到每秒几十万或者上百万的超高并发写入。 Produce 页缓存技术＋磁盘顺序写 Kafka接收到数据的时候，都会往磁盘上去写 Page Cache 内存里面的缓存，是操作系统自己管理的缓存。在写入磁盘文件的时候，可以直接写入到OS cache里。接下来由操作系统自己决定何时把cache里面的数据刷写到磁盘...

用嵌套的两个kafka实现突发性高并发consumer

吴景慈跑得快的博客

09-29

541

今天遇到一个问题，某个kafka comsumer特别耗时，排查发现，之前把一些操作写成串行了，但是这个comsumer属于那种来一波消息就中断的，改成并行的又需要大量资源(CPU/MEM)，不划算。后来同事提供了一种思路，将并行的操作拆另一个comsumer里用一个进程分个处理，这样前一个comsumer可以及时消费掉，并且不耗费资源，后一个comsumer串行地处理就不会有很长的耗时，解决了...

kafka如何实现高并发存储-如何找到一条需要消费的数据(阿里)

09-07

4436

阿里太注重原理了：阿里问kafka如何实现高并发存储-如何找到一条需要消费的数据这是答案：在partition中如何通过offset查找message 例如读取offset=368776的message，需要通过下面2个步骤查找。第一步查找segment file 上述图2为例，其中00000000000000000000.index表示最开始的文件，起始偏移量(offs...

Kafka 之高并发

最新发布

cjh的博客

10-23

kafka系列-kafka调优篇-高并发高吞吐架构设计

weixin_41279060的博客

12-15

7816

kafka的PageCache读写不同于Redis和MemcacheQ等内存消息队列，Kafka的设计是把所有的Message都要写入速度低容量大的硬盘，以此来换取更强的存储能力。实际上，Kafka使用硬盘并没有带来过多的性能损失（这一点是有条件限制的，这个条件是，消费者的消费速度要高于或等于生产者的速度）。 kafka重度依赖底层操作系统提供的PageCache功能。（文件缓存，速

聊一聊高并发高可用那些事 - Kafka篇

qq_20203755的博客

06-07

344

目录为什么需要消息队列 1.异步：一个下单流程，你需要扣积分，扣优惠卷，发短信等，有些耗时又不需要立即处理的事，可以丢到队列里异步处理。 2.削峰：按平常的流量，服务器刚好可以正常负载。偶尔推出一个优惠活动时，请求量极速上升。由于服务器 Redis，MySQL 承受能力不一样，如果请求全部接收，服务器负载不了会导致宕机。加机器嘛，需要去调整配置，活动结束后用不到了，即麻烦又浪费。这时可以将请求放到队列里，按照服务器的能力去消费。 3.解耦：一个订单流程，需要扣积分，优惠券，发短信等调用多个.

redis高并发下的处理考勤打卡数据

摩尔小哥

12-10

2566

背景最近公司用户量上来了，因此，对考勤打卡的瓶颈也就越发明显。每到打卡高峰期，公司APP就打开很慢，甚至服务开挂。针对这些问题，检查服务器发现，原来是考勤接口并发上来不停请求数据库导致的CPU剧增。因此，升级了服务器，提升了配置，但是还是不能抗住压力。因此，自己百度发现redis是个好东西，可以做缓存数据库，缓解mysql压力。因此，写下这篇文章。主要运用 - 1.redis:h...

Kafka为什么是高性能高并发高可用架构

赵广陆

09-19

879

目录 1 前言 2 顺序写入 3 页缓存 4 零拷贝 5 Broker 性能 6 流数据并行 7 总结 1 前言我们都知道 Kafka 是基于磁盘进行存储的，但 Kafka 官方又称其具有高性能、高吞吐、延时的特点，其吞吐量动辄几十上百万。小伙伴们是不是有点困惑了，一般认为在磁盘上读写数据是会降低性能的，因为寻址会比较消耗时间。那 Kafka 又是怎么做到其吞吐量动辄几十上百万的呢？

MyKafkaMs：这是一个基于kafka消息中间件的支持高并发下顺序执行的消息系统

02-18

MyKafkaMS 一个基于kafka中间件的高并发情况下顺序执行消息的消息系统系统服务器采用kafka官网提供的java脚本来创建，参数kafka / config / server.propertities如下：经纪人的ID。对于每个代理，必须将其设置为唯一的整数。 broker.id = 0 服务器用于接收来自网络的请求并向网络发送响应的线程数 num.network.threads = 3 服务器用于处理请求的线程数，其中可能包括磁盘I / O num.io.threads = 8 套接字服务器使用的发送缓冲区（SO_SNDBUF） socket.send.buffer.bytes = 102400 套接字服务器使用的接收缓冲区（SO_RCVBUF） socket.receive.buffer.bytes = 102400 套接字服务器将接受的请求的最大大小（针对OO

高并发面试必问：分布式消息系统Kafka简介

郭首志的博客

08-18

5594

卡夫卡是分布式发布 - 订阅消息系统它最初由LinkedIn公司开发，之后成为Apache的项目的一部分.Kafka是一个分布式的，可划分的，冗余备份的持久性的日志服务它主要用于处理。活跃的流式数据。在大数据系统中，常常会碰到一个问题，整个大数据是由各个子系统组成，数据需要在各个子系统中高性能，低延迟的不停流转。传统的企业消息系统并不是非常适合大规模的数据处理为了已在同时搞定在线应用（消息）和...