Kafka~Kafka高效读写的原因

本文探讨了如何通过分区存储和集群技术提升大数据处理的并行性,稀疏索引优化数据存取效率,以及顺序读写和零拷贝页缓存技术减少数据传输开销。Kafka的零拷贝特性使得生产者和消费者之间的数据交换更快速。

一、集群、采用分区技术

  • 采用分区存储的形式,可以提高生产端和消费端的并行度
  • 使用集群,可以把海量的数据无限的打散

二、稀疏索引

  • 使用稀疏索引,使得存取数据的效率更高

三、顺序读写

四、零拷贝和页缓存

  • 页缓存是Linux系统内核的缓存
  • 生产者生产数据时直接存入到Linux系统内核中,Kafka根据内存分配选择是否持久化到硬盘;消费端消费时直接从Linux系统内核中读取数据,省去了应用层的代码;
  • Kafka在集群中不进行数据处理,所有数据处理的工作都在生产端和消费端的拦截器上
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值