什么是kafka
Apache kafka是消息中间件的一种,我发现很多人不知道消息中间件是什么,在开始学习之前,我这边就先简单的解释一下什么是消息中间件,只是粗略的讲解,目前kafka已经可以做更多的事情。
以下例子来自互联网
举个例子,生产者消费者,生产者生产鸡蛋,消费者消费鸡蛋,生产者生产一个鸡蛋,消费者就消费一个鸡蛋,假设消费者消费鸡蛋的时候噎住了(系统宕机了),生产者还在生产鸡蛋,那新生产的鸡蛋就丢失了。再比如生产者很强劲(大交易量的情况),生产者1秒钟生产100个鸡蛋,消费者1秒钟只能吃50个鸡蛋,那要不了一会,消费者就吃不消了(消息堵塞,最终导致系统超时),消费者拒绝再吃了,”鸡蛋“又丢失了,这个时候我们放个篮子在它们中间,生产出来的鸡蛋都放到篮子里,消费者去篮子里拿鸡蛋,这样鸡蛋就不会丢失了,都在篮子里,而这个篮子就是”kafka“。
鸡蛋其实就是“数据流”,系统之间的交互都是通过“数据流”来传输的(就是tcp、http什么的),也称为报文,也叫“消息”。
消息队列满了,其实就是篮子满了,”鸡蛋“ 放不下了,那赶紧多放几个篮子,其实就是kafka的扩容。
各位现在知道kafka是干什么的了吧,它就是那个"篮子"。
kafka名词解释 producer:生产者,就是它来生产“鸡蛋”的。
consumer:消费者,生出的“鸡蛋”它来消费。
topic:你把它理解为标签,生产者每生产出来一个鸡蛋就贴上一个标签(topic),消费者可不是谁生产的“鸡蛋”都吃的,这样不同的生产者生产出来的“鸡蛋”,消费者就可以选择性的“吃”了。
broker:就是篮子了
单机kafka配置
步骤一:
解压kafka的tar包,然后cd进该目录,做步骤二和步骤三
tar xzvf kafka_2.11-0.11.0.0.tgz
步骤二:
启动Zookeeper server
bin/zookeeper-server-start.sh config/zookeeper.properties &
步骤三:
启动Kafka server
bin/kafka-server-start.sh config/server.properties &
步骤四:
如果要杀死kafka进程,建议用ps找到进程号,用kill -9 去杀。因为有些linux的版本用kafka内置命令去关进程,会关不掉。
步骤五:
开两个ssh,一个用来发数据,一个用来收数据
运行producer—生产者,及发送送数据,本地自己测试用localhost:9092,topic是test
[root@localhost kafka_2.11-0.11.0.0]#bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test
>
>
>
>test # 输入一个test
运行consumer—消费者,及接收数据,–from-beginning
[root@localhost kafka_2.11-0.11.0.0]# bin/kafka-console-consumer.sh --zookeeper localhost:2181 --topic test --from-beginning
test # 作为消费者看到test 上述测试就算成功
实际部署测试
拓扑图:
produce ------ kafka ------ consumer
测试kafka ip : 172.16.4.225 , topic:test
修改kafka的配置文件,最终配置成如下图:
启动Zookeeper server和Kafka server
bin/zookeeper-server-start.sh config/zookeeper.properties &
bin/kafka-server-start.sh config/server.properties &
运行生产者
bin/kafka-console-producer.sh --broker-list 172.16.4.225:9092 --topic test
>
>hello
运行消费者
bin/kafka-console-consumer.sh --zookeeper 172.16.4.225:2181 --topic test --from-beginning
hello