《深入理解kafka-核心设计与实践原理》

本文是对于《深入理解kafka-核心设计与实践原理》的笔记和提纲整理

主要用于复习和知识点快速复习

第一章:概念

链接:《深入理解kafka-核心设计与实践原理》第一章:概念

第一章:概念

  • [1.1] 基本概念
    • [1.1.1] 基本角色与概念
    • [1.1.2] 其他概念(AR、ISR、OSR、HW、LEO)
  • [1.2] 概念图

第二章:生产者

链接:《深入理解kafka-核心设计与实践原理》第二章:生产者

第二章:生产者

  • [2.1] api使用
    • [2.1.1] 生产者:KafkaProducer
    • [2.1.2] 消息体:ProducerRecord
    • [2.1.3] 序列化器:Serializer
    • [2.1.4] 分区器:Partitioner
    • [2.1.5] 拦截器:Interceptor
  • [2.2] 生产者客户端的原理
    • [2.2.1] 整体架构
    • [2.2.2] 元数据的更新
  • [2.3] 重要的生产者参数
    • [2.3.1] acks
    • [2.3.2] max.request.size
    • [2.3.3] retries和retry.backoff.ms
    • [2.3.4] 其他参数 

第三章:消费者

链接:《深入理解kafka-核心设计与实践原理》第三章:消费者

第三章:消费者

  • [3.1] 消费者与消费组
    • [3.1.1] 消费者(Consumer)
    • [3.1.2] 消费组(Consumer Group)
    • [3.1.3] 消息投递模式
  • [3.2] 客户端开发
    • [3.2.1] 必要的配置参数
    • [3.2.2] 订阅主题与分区
    • [3.2.3] 反序列化
    • [3.2.4] 消费消息
    • [3.2.5] 位移提交
      • [3.2.5.1] offset
      • [3.2.5.2] 消费后的提交方式:自动提交/手动提交
    • [3.2.6] 控制/关闭消费
    • [3.2.7] 指定位移消费
    • [3.2.8] 再均衡(Rebalance)
    • [3.2.9] 消费者拦截器
    • [3.2.10] 多线程实现
  • [3.3] 重要的消费者参数

第四章:主题和分区

链接:《深入理解kafka-核心设计与实践原理》第四章:主题和分区

第四章:主题和分区

  • [4.1] 主题管理
    • [4.1.1] 创建主题
  • [4.2] KafkaAdminClient
  • [4.3] 分区管理
    • [4.3.1] 优先副本的选举
    • [4.3.2] 分区重分配(Partition Reassignment)
    • [4.3.3] 复制限流
    • [4.3.4] 修改副本因子
  • [4.4] 分区和性能的考量因素

第五章:日志存储

链接:《深入理解kafka-核心设计与实践原理》第五章:日志存储

第五章:日志存储

  • [5.1] 文件目录布局
  • [5.2] kafka消息格式
    • [5.2.1] 消息格式
      • [5.2.1.1] v0版本(kafka 0.10.0前)
      • [5.2.1.2] v1版本(kafka 0.10.0至kafka 0.11.0)
      • [5.2.1.3] v2版本
  • [5.3] 日志索引
    • [5.3.1] 根据偏移量索引
    • [5.3.2] 根据时间戳索引
  • [5.4] 日志清理
    • [5.4.1] 日志删除
    • [5.4.2] 日志压缩
  • [5.5] 磁盘存储
    • [5.5.1] 顺序写磁盘
    • [5.5.2] 页缓存
    • [5.5.3] 零拷贝

补充:一些实际问题的理解

链接:《深入理解kafka》对于实际问题的理解

Q1:消息可靠性(不重不漏)

  • 1.1 如何保证消息不丢
  • 1.2 如何保证消息不重

Q2:积压/消费能力

  • 2.1 线上积压排查思路
  • 2.2 增加消费能力
  • 4
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
深入理解Kafka_核心设计实践原理》是一本关于Kafka的重要著作,以下是对该书的简要回答。 该书主要通过系统地介绍Kafka核心设计实践原理,帮助读者深入理解Kafka的内部机制和工作原理。首先,书中详细介绍了Kafka的基本概念,包括Kafka集群的组成、主题和分区的概念等,为读者建立起对Kafka的基础认识。 接着,该书深入探讨了Kafka消息的存储和传输机制。阐述了Kafka如何将消息持久化到磁盘,并通过基于磁盘的顺序写性能实现高吞吐量的特点。同时,还介绍了Kafka的消息分区和副本机制,解释了如何通过分区和副本分散消息的负载并提供数据的冗余性。 此外,该书还深入研究了Kafka的消息传输过程。对生产者和消费者的工作原理进行了详细解读,包括消息的发送和订阅过程以及Kafka如何保证消息的可靠性传输。同时,介绍了Kafka的消费组和分区再均衡机制,以及与ZooKeeper的整合。 最后,该书还对Kafka的高级特性进行了介绍,包括事务支持、使用Kafka Streams进行流处理、使用Kafka Connect进行数据集成等内容,帮助读者进一步了解和应用Kafka的高级功能。 综上所述,《深入理解Kafka_核心设计实践原理》是一本全面而深入的Kafka技术指南。通过阅读本书,读者可以深入理解Kafka核心设计实践原理,掌握Kafka的基本概念和工作原理,并能够应用Kafka解决实际问题。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值