Kafka概述

Kafka概述

Kafka起初是由LinkedIn公司采用Scala语言开发的一个多分区、多副本且基于ZooKeeper协调的分布式消息系统。

Zookeeper在Kafka中扮演的角色,进行Kafka元数据的管理及Kafka Controller的选举工作。Kafka 2.8.0版本之后已移除对Zookeeper的依赖,由kafka自身进行。

目前Kafka已经被定位成一个分布式流式处理系统平台,特点:高吞吐丶可持久化丶可水平拓展丶支持流处理等多种特性。

支持与各种流式计算框架集成,Spark,Flink,Storm等。

Kafka三大角色:

消息系统:

系统解耦、冗余存储、流量削峰、缓冲、异步通信、扩展性、可恢复性等功能。

Kafka还提供了消息系统难以实现的消息顺序性保障及回溯消费功能。

存储系统:

Kafka 把消息持久化到磁盘,相比于其他基于内存存储的系统而言,有效地降低了数据丢失的风险。也正是得益于Kafka 的消息持久化功能和多副本机制,我们可以把Kafka作为长期的数据存储系统来使用,只需要把对应的数据保留策略设置为“永久”或启用主题的日志压缩功能即可

流式处理平台:

Kafka Streams提供了丰富的类库,可以使用对于API进行开发。

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
要在虚拟机上安装Kafka,您可以按照以下步骤进行操作: 1. 首先,确保您已经安装了适当的虚拟化软件,例如VirtualBox或VMware。 2. 下载适用于您的操作系统的Kafka二进制文件。您可以从Apache Kafka官方网站(https://kafka.apache.org/downloads)上获取最新的稳定版本。 3. 创建一个新的虚拟机实例,并为其分配足够的资源(例如内存和存储空间)。 4. 安装和配置操作系统。对于大多数Linux发行版,您可以使用包管理器安装所需的软件包和依赖项。 5. 解压下载的Kafka二进制文件到虚拟机中的目录。您可以将其放在任何位置,只需确保您有相应的权限。 6. 在Kafka配置文件(位于Kafka安装目录下的config/server.properties)中进行必要的配置更改。主要是设置监听地址和端口,以及其他相关的配置参数。 7. 启动Zookeeper服务。Kafka使用Zookeeper来管理集群的协调。您可以根据Kafka版本自带的文档来启动Zookeeper服务。 8. 启动Kafka服务器。运行Kafka安装目录下的bin/kafka-server-start.sh脚本,并指定配置文件的路径。 9. 现在,您已经成功在虚拟机上安装了Kafka。您可以使用Kafka提供的命令行脚本或客户端库来创建主题、发送和接收消息等操作。 请注意,这只是一个概述,具体的步骤可能会因您使用的操作系统和版本而有所不同。在执行上述步骤时,最好参考Kafka官方文档和操作系统相关的文档,以获得更详细的指导。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值