学习计划 - kafka

学习目标

kafka为啥会产生?

应对实时处理需求,需要一个系统可以缓存数据,可以供多个其他程序进行读取和处理。

kafka产生了。 产生数据到kafka,应用程序可以对kafka里面的数据进行读取然后处理,而kafka仅仅是缓存数据,并对数据设置一个过期时间,这样可以做到持续运转无需人工干预,而且kafka有防单点功能,总结一句,kafka是一个提供数据存放和读取而又带有自动处理“污水”功能的蓄水池。

术语有哪些?

产生消息到kafka的叫做 producer

订阅topics以及消费kafka数据的叫做 consumer

kafka集群由一台或者多台服务器组成,每台服务器被叫做一个broker

每个topics里面的数据按照partition进行划分,consumer可以通过设置offset进行读取数据,只要数据还没有过期,因为kafka有log有效时间设置,过了之后,kafka会消灭过期的数据,free up disk。

每个topic由若干个partition组成,每个partition以及副本会分布在多个机器里面(副本数N,最多可以允许有N-1个broker挂掉),一般是3,3个partition有一台机器会作为Leader,其余两个作为Follower,跟其他分布式系统相似但也有不同,Leader partition会完成所有读写操作,而不仅仅是写操作,而Follower partition只能进行与Leader Partition进行同步,连读功能都不行!

典型应用

  • 日志聚合。 很多服务器产生的日志打向kafka,进行集中存放。
  • 流处理。一开始是粗糙的数据进入kafka,消费者对数据进行消费处理后把数据仍旧打进kafka,但是是另外一个topic。

深入和扩展

consumer。 一般消息系统的消费者有两种模型,一种是 queueing模型,另外一种是订阅和消费模型。 队列模型的时候,一个消息只能被一个消费者消费,然后下个消息被另外一个消费者消费,就是不可能做到一个消息被一群消费者消费。 kafka是第二种模型,但是也是支持第一种模型的哦。如果kafka的消费者们都在同一个组里面,那么就是第一种模型;如果消费者们分别在不同的组里面,那么就是第二种模型,可以做到一条消息,被多组消费者里面的消费者消费。

1/kafka是一个分布式的消息缓存系统 2/kafka集群中的服务器都叫做broker 3/kafka有两类客户端,一类叫producer(消息生产者),一类叫做consumer(消息消费者),客户端和broker服务器之间采用tcp协议连接 4/kafka中不同业务系统的消息可以通过topic进行区分,而且每一个消息topic都会被分区,以分担消息读写的负载 5/每一个分区都可以有多个副本,以防止数据的丢失 6/某一个分区中的数据如果需要更新,都必须通过该分区所有副本中的leader来更新 7/消费者可以分组,比如有两个消费者组A和B,共同消费一个topic:order_info,A和B所消费的消息不会重复 比如 order_info 中有100个消息,每个消息有一个id,编号从0-99,那么,如果A组消费0-49号,B组就消费50-99号 8/消费者在具体消费某个topic中的消息时,可以指定起始偏移量 每个partition只能同一个group中的同一个consumer消费,但多个Consumer Group可同时消费同一个partition。 n个topic可以被n个Consumer Group消费,每个Consumer Group有多个Consumer消费同一个topic Topic在逻辑上可以被认为是一个queue,每条消费都必须指定它的Topic,可以简单理解为必须指明把这条消息放进哪个queue里。为了使得Kafka的吞吐率可以线性提高,物理上把Topic分成一个或多个Partition,每个Partition在物理上对应一个文件夹,该文件夹下存储这个Partition的所有消息和索引文件。若创建topic1和topic2两个topic,且分别有13个和19个分区 Kafka的设计理念之一就是同时提供离线处理和实时处理。根据这一特性,可以使用Storm这种实时流处理系统对消息进行实时在线处理,同时使用Hadoop这种批处理系统进行离线处理,还可以同时将数据实时备份到另一个数据中心,只需要保证这三个操作所使用的Consumer属于不同的Consumer Group即可。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值