单节点的kafka安装及使用及kafka的简介

1.zookeeper的配置:

dataDir=/tmp/zookeeper

clientPort=2181

2.kafka的配置:

broker.id=0

listeners=PLAINTEXT://spark1:9092

log.dirs=/opt/softwares/kafka_2.11-2.4.1/log

zookeeper.connect=spark1:2181/kafka

3.kafka的使用:

启动kafka
bin/kafka-server-start.sh config/server.properties
创建Topic
bin/kafka-topics.sh  --zookeeper node1:2181/kafka  --create --topic topic-demo --replication-factor 1 --partitions 1 
生产数据
bin/kafka-console-producer.sh --broker-list spark1:9092 --topic demo1
消费数
bin/kafka-console-consumer.sh --bootstrap-server spark1:9092 --topic demo1

4.kafka的简介:

4.1.kafka的体系结构:

4.2主题与分区:

每一条消息被发送到topic之前,会根据分区规则选择存储到哪个具体的分区。

4.3分区多副本机制

4.4分区中偏移量的说明

AR:分区中的所有副本统称AR(Assigned Replicas)
ISR:是AR的子集,所有与leader副本保持一定程度同步的副本(包括leader副本)
OSR:与leader副本同步滞后过多的副本(不包括 leader副本)
 

4.5leader副本的推举

leader副本负责维护和跟踪ISR集合中所有follower副本的滞后状态

当follower落后太多或失效时,leader则把它从ISR中剔除,放入OSR

如果OSR中有follower副本“追上”时,leader则会把它从OSR中移到ISR

AR=ISR+OSR

默认情况下,当leader副本故障时,只有在ISR中的副本才有资格被选举为新的leader

4.6.ISR与HW和LEO的关系 :


HW:HW是High Watermark的缩写,俗称高水位,它标识了一个特定的消息偏移量(offset),消费者只能拉取这个offset之前的消息

LEO:是Log End Offset的缩写,它标识当前日志文件中下一条待写入消息的 offset

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值