Kafka

最新推荐文章于 2024-03-02 19:35:25 发布

蕾娃娃

最新推荐文章于 2024-03-02 19:35:25 发布

阅读量140

点赞数

分类专栏：消息中间件

原文链接：http://www.cnblogs.com/zhangs1986/p/6565639.html

版权

消息中间件专栏收录该内容

1 篇文章 0 订阅

订阅专栏

文章目录

一、kafka 应用场景
二、Kafka主要特点
三、Kafka的架构
四、几个基本概念
五、环境搭建

一、kafka 应用场景

1.日志收集：一个公司可以用Kafka可以收集各种服务的log，通过kafka以统一接口服务的方式开放给各种consumer，例如hadoop、Hbase、Solr等。

2.消息系统：解耦和生产者和消费者、缓存消息等。

3.用户活动跟踪：Kafka经常被用来记录web用户或者app用户的各种活动，如浏览网页、搜索、点击等活动，这些活动信息被各个服务器发布到kafka的topic中，然后订阅者通过订阅这些topic来做实时的监控分析，或者装载到hadoop、数据仓库中做离线分析和挖掘。

4.运营指标：Kafka也经常用来记录运营监控数据。包括收集各种分布式应用的数据，生产各种操作的集中反馈，比如报警和报告。

5.流式处理：比如spark streaming和storm

6.事件源：解耦、扩展性、可恢复性、顺序保证、缓冲、异步通信

二、Kafka主要特点

同时为发布和订阅提供高吞吐量。据了解，Kafka每秒可以生产约25万消息（50 MB），每秒处理55万消息（110 MB）。
可进行持久化操作。将消息持久化到磁盘，因此可用于批量消费，例如ETL，以及实时应用程序。通过将数据持久化到硬盘以及replication防止数据丢失。
分布式系统，易于向外扩展。所有的producer、broker和consumer都会有多个，均为分布式的。无需停机即可扩展机器。
消息被处理的状态是在consumer端维护，而不是由server端维护。当失败时能自动平衡。
支持online和offline的场景。

三、Kafka的架构

Kafka 的整体架构非常简单，是显式分布式架构，producer、broker（kafka）和consumer都可以有多个。 Producer，consumer实现Kafka注册的接口，数据从producer发送到broker，broker承担一个中间缓存和分发的作用。 broker分发注册到系统中的consumer。broker的作用类似于缓存，即活跃的数据和离线处理系统之间的缓存。客户端和服务器端的通信，是基于简单，高性能，且与编程语言无关的TCP协议。