一、[订阅剖析:订阅
### --- 主题和分区
~~~ # Topic,Kafka用于分类管理消息的逻辑单元,类似与MySQL的数据库。
~~~ Partition,是Kafka下数据存储的基本单元,这个是物理上的概念。
~~~ 同一个topic的数据,会被分散的存储到多个partition中,
~~~ 这些partition可以在同一台机器上,也可以是在多台机器上。
~~~ # 优势在于:
~~~ 有利于水平扩展,避免单台机器在磁盘空间和性能上的限制,
~~~ 同时可以通过复制来增加数据冗余性,提高容灾能力。
~~~ 为了做到均匀分布,通常partition的数量通常是Broker Server数量的整数倍。
~~~ # Consumer Group,
~~~ 同样是逻辑上的概念,是Kafka实现单播和广播两种消息模型的手段。
~~~ 保证一个消费组获取到特定主题的全部的消息。
~~~ 在消费组内部,若干个消费者消费主题分区的消息,
~~~ 消费组可以保证一个主题的每个分区只被消费组中的一个消费者消费。
~~~ # consumer 采用 pull 模式从 broker 中读取数据。
~~~ 采用 pull 模式,consumer 可自主控制消费消息的速率,
~~~ 可以自己控制消费方式(批量消费/逐条消费),还可以选择不同的提交方式从而实现不同的传输语义。
~~~ # consumer.subscribe("tp_demo_01,tp_demo_02")