大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳,不仅形成深入且独到的理解,而且能够帮助新手快速入门。
本文主要是从小白的角度讲解kafka并使用java、python_API进行实战,希望能对学习kafka的同学们有所帮助。
1. 什么是kafka
1.1 基本概述
提前说明,以下主要涉及kafka、topic、partition、broker、offset、replica、leader、follower、Consumer Group等概念
首先kafka是用来存储数据的,就像sql等数据库一样。
向kafka中放数据的人叫做生产者(Producer),从kafka取数据的人叫做消费者。(Consumer )
打个比方,假设kafka就是一张excel工作簿。最开始这个工作簿(数据库)是没有数据的,需要有人在excel工作簿里填写数据