Kafka基本概念
Kafka 是一种分布式的,基于发布 / 订阅的消息系统。主要设计目标如下:
- 以时间复杂度为 O(1) 的方式提供消息持久化能力,即使对 TB 级以上数据也能保证常数时间复杂度的访问性能。
- 高吞吐率。即使在非常廉价的商用机器上也能做到单机支持每秒 100K 条以上消息的传输。
- 支持 Kafka Server 间的消息分区,及分布式消费,同时保证每个 Partition 内的消息顺序传输。
- 同时支持离线数据处理和实时数据处理。
- Scale out:支持在线水平扩展。
上述内容引自
Kafka【入门】就这一篇
对基础概念的介绍很详尽了
Kafka-Python实践
官方文档:
安装
pip install kafka-python
生产者
作用是发送(生产)消息到Kafka,初步设置如下
from kafka import KafkaProducer
'''ip地址:端口号,server也可为一个字符串列表,代表