Kafka性能及应用场景介绍
大数据里面很火的技术Kafka,Kafka 是一个分布式的消息系统,其高性能在圈内很出名。比如说,kafka可以支持多生产者、多消费者、基于磁盘的数据存储,伸缩性、高性能轻松处理巨大的消息流。
Kafka也具备多应用场景,比如用于开发消息系统,网站活动数据追踪、日志聚合、流处理等。
什么是kafka
Kafka 底层的 IO 用的是 NIO,Kafka最初由Linkedin公司开发,是一个分布式的、分区的、多副本的、多订阅者,基于zookeeper协调的分布式日志系统。
Kafka主要特性
1)高吞吐量、低延迟:kafka每秒可以处理大批量数据,数据延迟是毫秒级别的,其具备独特的高可用特性;
2)可扩展性:kafka集群支持横向扩展,支持高可用下应用场景;
3)持久性、可靠性:消息被持久化到本地磁盘,避免数据遗失,具备可恢复性特点;
4)容错性:允许集群中的节点失败;
5)高并发:单机可支持数千个客户端同时读写,具备高可用应用场景;