[TL4]分布式框架专题-Kafka
文章平均质量分 81
[TL4]分布式框架专题-Kafka
萧 炎
这个作者很懒,什么都没留下…
展开
-
Kafka可视化管理工具kafka-manager部署安装和使用-已更名为CMAK
一、kafka-manager 简介为了简化开发者和服务工程师维护Kafka集群的工作,yahoo构建了一个叫做Kafka管理器的基于Web工具,叫做 Kafka Manager。这个管理工具可以很容易地发现分布在集群中的哪些topic分布不均匀,或者是分区在整个集群分布不均匀的的情况。它支持管理多个集群、选择副本、副本重新分配以及创建Topic。同时,这个管理工具也是一个非常好的可以快速浏览这个集群的工具,有如下功能:1.管理多个kafka集群2.便捷的检查kafka集群状态(topics,br转载 2021-09-05 10:04:13 · 20879 阅读 · 0 评论 -
Kafka生产环境问题总结及性能优化实战:JVM参数设置、消息丢失、重复消费、消息乱序、延时队列、消息回溯、分区数量设置、消息传递保障、kafka的事务、kafka高性能的原因
一、线上环境规划二、JVM参数设置kafka是scala语言开发,运行在JVM上,需要对JVM参数合理设置。修改bin/kafka-start-server.sh中的jvm设置,假设机器是32G内存,可以如下设置:export KAFKA_HEAP_OPTS="-Xmx16G -Xms16G -Xmn10G -XX:MetaspaceSize=256M -XX:+UseG1GC -XX:MaxGCPauseMillis=50 -XX:G1HeapRegionSize=16M"这种大内存的情况一原创 2021-09-05 09:17:16 · 1954 阅读 · 0 评论 -
Kafka设计原理详解: Controller选举、Partition副本选举Leader、消费者Rebalance分区分配、HE与LEO、日志分段存储、ZK节点数据
日志分段存储Kafka 一个分区的消息数据对应存储在一个文件夹下,以topic名称+分区号命名,消息在分区内是分段(segment)存储,每个段的消息都存储在不一样的log文件里,这种特性方便old segment file快速被删除,kafka规定了一个段位的 log 文件最大为 1G,做这个限制目的是为了方便把 log 文件加载到内存去操作:# 部分消息的offset索引文件,kafka每次往分区发4K(可配置)消息就会记录一条当前消息的offset到index文件,# 如果要定位消息的offse原创 2021-09-04 16:01:34 · 1073 阅读 · 0 评论 -
SpringBoot整合Kafka
现在大多数公司都是使用SpringBoot技术,所以使用SpringBoot整合Kafka是比较重要的。接下来我们就来使用SpringBoot整合Kafka。一、项目构建我们首先创建一个基于maven的SpringBoot项目.1、pom依赖<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.原创 2021-08-31 21:11:46 · 11800 阅读 · 3 评论 -
Java客户端访问Kafka & 重点配置参数理解
熟悉了Kafka之后,我们来试着使用java代码来操作Kafka。我们可以先建立一个maven项目。1 引入maven依赖创建完maven项目后,我们引入Kafka的依赖:<dependencies> <dependency> <groupId>org.apache.kafka</groupId> <artifactId>kafka-clients</artifactId原创 2021-08-31 19:06:28 · 1771 阅读 · 0 评论 -
kafka手把手集群构建与消费实战
一、集群搭建对于kafka来说,一个单独的broker意味着kafka集群中只有一个节点。要想增加kafka集群中的节点数量,只需要多启动几个broker实例即可。为了有更好的理解,现在我们在一台机器上同时启动三个broker实例。首先,我们需要建立好其他2个broker的配置文件:cp config/server.properties config/server-1.propertiescp config/server.properties config/server-2.properties原创 2021-08-31 11:21:16 · 572 阅读 · 0 评论 -
Kafka快速实战与基本原理详解
Kafka是最初由Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于hadoop的批处理系统、低延迟的实时系统、Storm/Spark流式处理引擎,web/nginx日志、访问日志,消息服务等等,用scala语言编写,Linkedin于2010年贡献给了Apache基金会并成为顶级开源项目。一、Kafka的使用场景日志收集:一个公司可以用.原创 2021-08-30 19:59:30 · 320 阅读 · 0 评论