#感兴趣的可以去这两个官网查看
# aws亚马逊:https://aws.amazon.com/cn/msk/what-is-kafka/
# 红帽:https://www.redhat.com/zh/topics/integration/what-is-apache-kafka
Apache kafka主要由scala语言开发的开源分布式消息系统,主要用于实现低延迟的发送和收集大量的时间和日志数据-----这些数据通常都是活跃的数据。所谓活跃数据,在互联网大型的web网站应用中非常常见,通常是指网站的PV数( 页面浏览量 )和用户访问记录等。这些数据通常以日志的形式记录下来,然后由一个专门的系统来进行日志的收集与统计。
kafka是一个吞吐量极高的分布式消息系统,其整体设计时典型的发布与订阅模式系统。在kafka集群中,没有“中心主节点”的概念,集群中所有的服务器都是对等的,因此,可以在不做大量配置更改的情况下实现服务器的添加与删除(集群的扩容/缩容),同样,消息的生产者和消费者也能够做到随意重启和机器的上下线。kafka服务器及消息生产者和消费者之间的部署关系如下图: