KAFKA
文章平均质量分 93
000X000
这个作者很懒,什么都没留下…
展开
-
2023,你了解Kafka吗?深入详解
深入详解Kafka原创 2023-04-28 09:30:28 · 970 阅读 · 0 评论 -
Kafka 开发基础总结
Kafka 开发基础总结原创 2022-05-28 15:33:15 · 212 阅读 · 0 评论 -
Kafka 万亿级消息实践
Kafka 万亿级消息实践之资源组流量掉零故障排查分析原创 2022-05-23 09:33:15 · 736 阅读 · 0 评论 -
Kafka 开发基础(经典收藏版)
为什么需要使用kafka从本质上来讲,是因为互联网发展太快,使用单体架构无疑会是的体量巨大。而微服务架构可以很好的解决这个问题,但是服务与服务之间会还是出现耦合、访问控制等问题。 消息队列可以很好的满足这些需要。它常用来实现:异步处理、服务解耦、流量控制异步处理随着业务的不断增加,通常会在原有的服务上添加上新服务,这样会出现请求链路越来越长,链路latency也就逐步增加。例如:最开始的电商项目,可能就是简简单单的扣库存、下单。慢慢地又加上了积分服务、短信服务等。链路增长不可避免的laten原创 2022-02-28 10:44:32 · 1881 阅读 · 0 评论 -
Kafka性能压测完整版
1.压测方案1.1 压测目的本次性能测试在正式环境下单台服务器上Kafka处理MQ消息能力进行压力测试。测试包括对Kafka写入MQ消息和消费MQ消息进行压力测试,根据不同量级的消息处理结果,评估Kafka的处理性能是否满足项目需求(该项目期望Kafka能够处理上亿级别的MQ消息)。1.2 测试范围及方法1.2.1 测试范围概述测试使用Kafka自带的测试脚本,通过命令对Kafka发起写入MQ消息和Kafka消费MQ消息的请求。模拟不同数量级的消息队列的消息写入和消费场景,根据Kaf转载 2021-08-25 16:40:17 · 10250 阅读 · 2 评论 -
Kafka最全知识总结(建议收藏)
1、为什么有消息系统 解耦合 异步处理 例如电商平台,秒杀活动。一般流程会分为:1:风险控制、2:库存锁定、3:生成订单、4:短信通知、5:更新数据 通过消息系统将秒杀活动业务拆分开,将不急需处理的业务放在后面慢慢处理;流程改为:1:风险控制、2:库存锁定、3:消息系统、4:生成订单、5:短信通知、6:更新数据 流量的控制 1. 网关在接受到请求后,就把请求放入到消息队列里面 2.后端的服务从消息队列里面获取到请求,完成后续的秒杀处理流程。然后再给用户返回结果。优点:控.原创 2021-08-24 09:05:00 · 1349 阅读 · 2 评论 -
Kafka最详细总结
KafkaKafka是最初由Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于hadoop的批处理系统、低延迟的实时系统、storm/Spark流...原创 2021-05-28 14:44:16 · 1384 阅读 · 0 评论 -
面试总结(四):消息队列
问题导读:1、什么是异步处理?2、P2P的特点是什么?3、如何防止消息丢失?二、消息队列消息队列中间件是分布式系统中重要的组件,主要解决应用耦合,异步消息,流量削锋等问题实现高性能,高可用,可伸缩和最终一致性架构使用较多的消息队列有ActiveMQ,RabbitMQ,ZeroMQ,Kafka,MetaMQ,RocketMQ消息队列应用场景以下介绍消息队列在实际应用中常用的使用场景。异步处理,应用解耦,流量削锋和消息通讯四个场景异步处理场景说明:用户注册后,需要发注册邮件和注册短信。传统的做法有两.原创 2021-03-17 09:31:00 · 261 阅读 · 0 评论 -
实战--Kafka学习(二)
问题导读1.Kafka工作包含哪些流程?2.为防止log文件过大导致数据定位效率低下,kafka引入了什么?3.Kafka生产者分区的原因和原则是什么?4.Kafka数据可靠性是如何保证的?3.1 Kafka工作流程及文件存储机制Kafka中消息是以topic进行分类的,生产者生产消息,消费者消费消息,都是面向topic的。topic是逻辑上的概念,而partition是物理上的概念,每个partition对应于一个log文件,该log文件中存储的就是producer生产的数据。Producer生产的数原创 2020-09-25 10:43:36 · 328 阅读 · 0 评论 -
实战--Kafka入门(一)
问题导读:1、如何理解消息队列(MessageQueue)?2、如何解析Kafka基础架构?3、如何安装Kafka集群?4、Kafka命令行操作有哪些?第1章Kafka概述1.1定义Kafka是一个分布式的基于发布/订阅模式的消息队列,主要应用于大数据实时处理领域。1.2消息队列(MessageQueue)1.2.1传统消息队列的应用场景1.2.2消息队列的两种模式(1)点对点模式(一对一,消费者主动拉取数据,消息收到后消息清除)消息生产者生产消息发送到Queue中,...原创 2020-09-25 10:41:09 · 176 阅读 · 0 评论 -
大数据技术面试-Flume、kafka
大数据技术面试-Flume、kafka1.Flume组成有哪些?2.Flume拦截器有哪些知识点?3.Flume采集数据会丢失吗?4.FileChannel如何优化?5.如何控制Kafka丢不丢数据?6.Kafka分区分配策略默认哪两种?4.4 Flume相关总结4.4.1 Flume组成,Put事务,Take事务1)Flume组成,Put事务,Take事务 Taildir Source:断点续传、多目录。Flume1...原创 2020-09-25 10:31:32 · 319 阅读 · 0 评论 -
Kafka分区数量设置详解
Kafka分区数量设置详解问题导读:1. Kafka分区多有哪些优点?2. Kafka的分区是不是越多越好?3. Kafka如何确定分区数量?场景描述:Kafka使用分区将topic的消息打散到多个分区分布保存在不同的broker上,实现了producer和consumer消息处理的高吞吐量。Kafka的producer和consumer都可以多线程地并行操作,而每个线程处理的是一个分区的数据。因此分区实际上是调优Kafka并行度的最小...原创 2020-09-08 10:42:36 · 11793 阅读 · 0 评论 -
Kafka各个版本差异总结
Kafka各个版本差异总结问题导读:1. Kafka如何做到升级不停机?2. Kafka各个版本有哪些显著变化?3. Kafka新版本设计哪些协议?Kafka 2.0.0引入了线程协议的变化。通过遵循下面建议的滚动升级计划,您可以保证在升级期间不会出现停机。但是,请在升级之前查看2.0.0中的重大更改。对于滚动升级: 1. 更新所有代理上的server.properties并添加以下属性。CURRENT_KAFKA_VE...原创 2020-09-08 10:38:51 · 2090 阅读 · 0 评论 -
一文理解Kafka消息存储到Broker中的过程
问题导读:1、kafka客户端有哪些组件?2、客户端缓存存储模型原理?3、如何确定消息的 partition 位置?4、如何发送线程的工作原理?前言经过上篇文章的简单实战之后,今天来聊聊生产者将消息从客户端发送到 Broker 上背后发生了哪些故事,看不看由你,但是我保证可以本篇文章你一定可以学到应用背后的一些实质东西。本文我们从以下 4 个方面来探讨下一条消息如何被准确的发送到 Broker 的 partition 上。1. 客户端组件2. 客户端缓存存储模型3. 确定消息的 partition原创 2020-05-13 15:02:22 · 462 阅读 · 0 评论 -
Kafka!(多图+深入)原理详解
一、kafka概述1.1、定义Kakfa是一个分布式的基于发布/订阅模式的消息队列(message queue),主要应用于大数据的实时处理领域1.2、消息队列1.2.1、传统的消息队列&新式的消息队列的模式上面是传统的消息队列,比如一个用户要注册信息,当用户信息写入数据库后,后面还有一些其他流程,比如发送短信,则需要等这些流程处理完成后,在返回给用户而新式的队...原创 2020-04-08 10:30:55 · 9776 阅读 · 0 评论 -
Apache Kafka 集群架构
Kafka的集群图:下表描述了上图中显示的每个组件。S.No 组件和说明 1 Broker(代理) Kafka集群通常由多个代理组成以保持负载平衡。Kafka代理是无状态的,所以他们使用ZooKeeper来维护它们的集群状态。一个Kafka代理实例可以每秒处理数十万次读取和写入,每个Broker可以处理TB的消息,而没有性能影响。Kafka经纪人领导...原创 2019-03-19 16:14:13 · 285 阅读 · 0 评论 -
kafka入门:简介、使用场景、设计原理、主要配置及集群搭建
一、入门 1、简介 Kafka is a distributed,partitioned,replicated commit logservice。它提供了类似于JMS的特性,但是在设计实现上完全不同,此外它并不是JMS规范的实现。kafka对消息保存时根据Topic进行归类,发送消息者成为Producer,消息接受者成为Consumer,此外kafka集群有多个kafka实例...原创 2019-03-19 11:17:05 · 161 阅读 · 0 评论 -
Kafka分布式消息队列框架
kafka开发的主要初衷目标是构建一个用来处理海量日志,用户行为和网站运营统计等的数据处理框架。在结合了数据挖掘,行为分析,运营监控等需求的情况下,需要能够满足各种实时在线和批量离线处理应用场合对低延迟和批量吞吐性能的要求。从需求的根本上来说,高吞吐率是第一要求,其次是实时性和持久性。既有的消息队列框架或者对消息传送的可靠性提供了较高的保证,由此带来较大的负担,不能满足海量高吞吐率的要求...原创 2019-03-19 14:28:52 · 174 阅读 · 0 评论 -
kafka流程原理详解
简介kafka是一个分布式消息队列。具有高性能、持久化、多副本备份、横向扩展能力。生产者往队列里写消息,消费者从队列里取消息进行业务逻辑。一般在架构设计中起到解耦、削峰、异步处理的作用。kafka对外使用topic的概念,生产者往topic里写消息,消费者从读消息。为了做到水平扩展,一个topic实际是由多个partition组成的,遇到瓶颈时,可以通过增加partition的数量来进行横...原创 2019-04-04 15:45:17 · 288 阅读 · 0 评论 -
官方文档 Kafka介绍
目录一: 流媒体平台的三个关键功能二:流媒体平台的三个关键功能三:kafka通常用于两大类应用3.1 几个概念:四:Kafka的四个核心API:4.1 Topics and Logs4.2 Distribution4.3 Producers4.4 Consumers4.5 Guarantees五:Kafka as a Messaging Syste...原创 2019-05-29 11:20:16 · 167 阅读 · 0 评论 -
Apache Kafka Deep 解析
1、首先了解主题,经纪人,生产者和消费者等主要术语。下图说明了主要术语,表格详细描述了图表组件。在上图中,主题配置为三个分区。分区1具有两个偏移因子0和1.分区2具有四个偏移因子0,1,2和3.分区3具有一个偏移因子0.副本的id与承载它的服务器的id相同。假设,如果主题的复制因子设置为3,那么Kafka将创建每个分区的3个相同的副本,并将它们放在集群中以使其可用于其所有操作。为...原创 2019-03-19 16:00:55 · 164 阅读 · 0 评论