详解Kafka与ActiveMQ的区别与联系!

在大数据开发过程中我们经常会使用到消息队列类型的组件,比较常见的就是Kafka与ActiveMQ,但很多同学闹不懂两者的区别和联系,今天小千就来带大家分析一下。

一、背景分析

消息队列这个类型的组件一直是非常重要的组件,当经过两家企业后我就很坚信这个结论了。队列这种东西,最广泛的作用还是在于解耦,宽泛一点的说,它可以将不同部门的工作内容进行有效的整合,基于一个约定好的格式,就可以两头互相不干扰的进行开发。可以说这个生产消费的思想不仅仅适用于程序也适用于非常多的地方。

目前对于我看到的来说,Kafka更多的还是做为一个数据源,数据桥梁的作用,不同业务之间的沟通。比如需要实时接入A部门的业务数据的话,就会有这样的手段:
在这里插入图片描述
落地到HDFS的数据会用来进行一些算法上的离线处理,而Kafka端则是给需要实时性的消费方。其实数据的消费方式无非也就实时和离线两种方式。

二、Kafka和ActiveMQ对比

相比过去经常使用的ActiveMQ,Kafka确实非常的不同,做一个对比来深化印象
在这里插入图片描述
说到底,做为kafka的消费方,能感受到最大的不同还是在于几个:
1.吞吐量确实非常高

2.可以重读历史数据

3.但是也有一些缺点:概念上比较复杂,相对于AMQ只需要知道ip和队列名你就能获得数据,Kafka使用起来非常繁琐。

三、Kafka的基本概念(摘录)

1.Broker:消息中间件处理结点,一个Kafka节点就是一个broker,多个broker可以组成一个Kafka集群。

2.Topic:一类消息,例如page view日志、click日志等都可以以topic的形式存在,Kafka集群能够同时负责多个topic的分发。

3.Partition:topic物理上的分组,一个topic可以分为多个partition,每个partition是一个有序的队列。

4.Segment:partition物理上由多个segment组成。

5.offset:每个partition都由一系列有序的、不可变的消息组成,这些消息被连续的追加到partition中。partition中的每个消息都有一个连续的序列号叫做offset,用于partition唯一标识一条消息。

四、Kafka消费端的常用参数

在这里插入图片描述
看过上面的介绍之后,相信大家对Kafka与ActiveMQ都有一定的了解了吧。想了解更多大数据开发技巧,欢迎关注我哟!

本文来自千锋教育,转载请注明出处。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值