消息中间件中的王者：Kafka！应付Kafka面试，看这篇就够了

最新推荐文章于 2022-07-17 18:19:46 发布

爱穿格子衫的程序猿

最新推荐文章于 2022-07-17 18:19:46 发布

阅读量326

点赞数

分类专栏： Java 文章标签： java

本文链接：https://blog.csdn.net/yoyo31/article/details/120208373

版权

为什么要使用 kafka？
kafka的数据可靠性怎么保证
Kafka的数据是放在磁盘上还是内存上，为什么速度会快？
副本数据同步策略
故障处理
kafka事务是怎么实现的
Kafka为什么不支持读写分离？
Kafka的数据是放在磁盘上还是内存上，为什么速度会快？
总结

为什么要使用 kafka？

缓冲和削峰：上游数据时有突发流量，下游可能扛不住，或者下游没有足够多的机器来保证冗余，kafka在中间可以起到一个缓冲的作用，把消息暂存在kafka中，下游服务就可以按照自己的节奏进行慢慢处理。
解耦和扩展性：项目开始的时候，并不能确定具体需求。消息队列可以作为一个接口层，解耦重要的业务流程。只需要遵守约定，针对数据编程即可获取扩展能力。
冗余：可以采用一对多的方式，一个生产者发布消息，可以被多个订阅topic的服务消费到，供多个毫无关联的业务使用。
健壮性：消息队列可以堆积请求，所以消费端业务即使短时间死掉，也不会影响主要业务的正常进行。
异步通信：很多时候，用户不想也不需要立即处理消息。消息队列提供了异步处理机制，允许用户把一个消息放入队列，但并不立即处理它。想向队列中放入多少消息就放多少，然后在需要的时候再去处理它们。

kafka的数据可靠性怎么保证

为保证producer发送的数据，能可靠的发送到指定的topic，topic的每个partition收到producer发送的数据后，都需要向producer发送ack（acknowledgement确认收到），如果producer收到ack，就会进行下一轮的发送，否则重新发送数据。所以引出ack机制。 ack应答机制 Kafka为用户提供了三种可靠性级别，用户根据对可靠性和延迟的要求进行权衡，选择以下的配置。acks参数配置：

0：producer不等待broker的ack，这一操作提供了一个最低的延迟，broker一接收到还没有写入磁盘就已经返回，当broker故障时有可能丢失数据。
1：producer等待broker的ack，partition的leader落盘成功后返回ack，如果在follower同步成功之前leader故障，那么将会丢失数据。

消息中间件中的王者：Kafka！应付Kafka面试，看这篇就够了

-1（all）：producer等待broker的ack，partition的leader和follower全部落盘成功后才返回ack。但是如果在follower同步完成后，broker发送ack之前，leader发生故障，那么会造成数据重复。

消息中间件中的王者：Kafka！应付Kafka面试，看这篇就够了

Kafka的数据是放在磁盘上还是内存上，为什么速度会快？

kafka使用的是磁盘存储。速度快是因为：顺序写入：因为硬盘是机械结构，每次读写都会寻址->写入，其中寻址是一个“机械动作”，它是耗时的。所以硬盘 “讨厌”随机I/O，喜欢顺序I/O。为了提高读写硬盘的速度，Kafka就是使用顺序I/O。Memory Mapped Files（内存映射文件）：64位操作系统中一般可以表示20G的数据文件，它的工作原理是直接利用操作系统的Page来实现文件到物理内存的直接映射。完成映射之后你对物理内存的操作会被同步到硬盘上。

Kafka高效文件存储设计： Kafka把topic中一个parition大文件分成多个小文件段，通过多个小文件段，就容易定期清除或删除已经消费完文件，减少磁

最低0.47元/天解锁文章

爱穿格子衫的程序猿

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
消息中间件中的王者：Kafka！应付Kafka面试，看这篇就够了

为什么要使用 kafka？ kafka的数据可靠性怎么保证 Kafka的数据是放在磁盘上还是内存上，为什么速度会快？副本数据同步策略故障处理 kafka事务是怎么实现的 Kafka为什么不支持读写分离？ Kafka的数据是放在磁盘上还是内存上，为什么速度会快？总结为什么要使用 kafka？缓冲和削峰：上游数据时有突发流量，下游可能扛不住，或者下游没有足够多的机器来保证冗余，kafka在中间可以起到一个缓冲的作用，把消息暂存在kafka中，下游服务就可以按照自己的节奏进行慢慢处理。
复制链接

扫一扫