大数据——使用Java连接至Kafka

最新推荐文章于 2024-07-24 16:37:05 发布

蜂蜜柚子加苦茶

最新推荐文章于 2024-07-24 16:37:05 发布

阅读量1.3k

点赞数

文章标签： kafka java 大数据 zookeeper hadoop

本文链接：https://blog.csdn.net/dsjia2970727/article/details/110879401

版权

本文通过Java实现Kafka的生产者和消费者应用。首先创建了一个名为kb09two的Kafka主题，然后在Java中添加Kafka-clients依赖并创建生产者发送消息。接着，展示如何通过消费者单线程和多线程拉取数据。最后，通过命令行工具检查topic数据和消费数据。

摘要由CSDN通过智能技术生成

使用Java连接至Kafka

使用Java连接至Kafka

使用Java连接至Kafka

创建一个topic，并查看详情

[root@hadoop100 ~]# kafka-topics.sh --zookeeper 192.168.136.100:2181 --create --topic kb09two --partitions 3 --replication-factor 1
[root@hadoop100 ~]# kafka-topics.sh --zookeeper 192.168.136.100:2181 --topic kb09two --describe

在这里插入图片描述

打开IDEA
添加依赖包

</dependency>
    <dependency>
      <groupId>org.apache.kafka</groupId>
      <artifactId>kafka-clients</artifactId>
      <version>2.0.0</version>
    </dependency>

所有的依赖包

<dependencies>
    <dependency>
      <groupId>junit</groupId>
      <artifactId>junit</artifactId>
      <version>4.12</version>
      <scope>test</scope>
    </dependency>
    <!-- https://mvnrepository.com/artifact/org.apache.flume/flume-ng-core -->
    <dependency>
      <groupId>org.apache.flume</groupId>
      <artifactId>flume-ng-core</artifactId>
      <version>1.6.0</version>
    </dependency>
    <dependency>
      <groupId>org.apache.kafka</groupId>
      <artifactId>kafka-clients</artifactId>
      <version>2.0.0</version>
    </dependency>
  </dependencies>

创建生产者MyProducer类

package nj.zb.kb09;

import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.ProducerConfig;
import org.apache.kafka.clients.producer.ProducerRecord;
import org.apache.kafka.common.serialization.StringSerializer;

import java.util.Properties;

public class MyProducer {
	public static void main(String[] args) {
		Properties prop = new Properties();
		 prop.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, "192.168.136.100:9092");
		 prop.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, StringSerializer.class);
		 prop.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG,StringSerializer.class);
		 prop.put(ProducerConfig.ACKS_CONFIG,"-1");

		KafkaProducer<String, String> producer = new KafkaProducer<>(prop);
		for (int i =0; i <200 ; i++) {
			ProducerRecord<String,String> producerRecord=new ProducerRecord<>("kb09two","hello world" +i);
			producer.send(producerRecord);
			try {
				Thread.sleep(100);
			} catch (InterruptedException e) {
				e.printStackTrace();
			}
		}
		System.out.println("Game over");
	}
}

运行程序
进入kafka，查看topic中各个分区中的数据数量

[root@hadoop100 ~]# kafka-run-class.sh kafka.tools.GetOffsetShell --broker-list 192.168.136.100:9092 --topic kb09two --time -1 --offsets 1

在这里插入图片描述

从消费者拉取生产者传入的数据

[root@hadoop100 ~]# kafka-console-consumer.sh --bootstrap-server 192.168.136.100:9092 --topic kb09two --from-beginning

在这里插入图片描述

创建消费者单线程MyConsumer类拉取数据

package nj.zb.kb09;

import org.apache.kafka.clients.consumer.ConsumerConfig;
import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;
import org.apache.kafka.common.serialization.StringDeserializer;

import java.util.Collections;
import java.util.Properties;

public class MyConsumer {
	public static void main(String[] args) {
		Properties prop = new Properties();
		prop.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, "192.168.136.100:9092");
		prop.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class);
		prop.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class);
		prop.put(ConsumerConfig.SESSION_TIMEOUT_MS_CONFIG, "30000");
		prop.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, "false");
		prop.put(ConsumerConfig.AUTO_COMMIT_INTERVAL_MS_CONFIG, "1000");
		//earliest 从最早的开始（不记录提交点）
		//latest 从最新的开始（记录提交点）
		//none 报错
		prop.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest");


		prop.put(ConsumerConfig.GROUP_ID_CONFIG, "G1");
		KafkaConsumer<String, String> consumer = new KafkaConsumer<>(prop);
		//消费者订阅
		consumer.subscribe(Collections.singleton("kb09two"));

		//一个消费者组G1里只有一个消费者
		while (true){
			ConsumerRecords<String, String> poll = consumer.poll(100);
			for (ConsumerRecord<String,String> record:
				 poll) {
				System.out.println(record.offset() + "\t" + record.key() + "\t" + record.value());

			}
		}
	}
}

结果展示：
在这里插入图片描述

创建消费者多线程MyConsumer2类拉取数据

package nj.zb.kb09;

import org.apache.kafka.clients.consumer.ConsumerConfig;
import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;
import org.apache.kafka.common.serialization.StringDeserializer;

import java.util.Collections;
import java.util.Properties;

public class MyConsumer2 {
	public static void main(String[] args) {
		Properties prop = new Properties();
		prop.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, "192.168.136.100:9092");
		prop.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class);
		prop.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class);
		prop.put(ConsumerConfig.SESSION_TIMEOUT_MS_CONFIG, "30000");
		prop.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, "false");
		prop.put(ConsumerConfig.AUTO_COMMIT_INTERVAL_MS_CONFIG, "1000");
		//earliest 从最早的开始（不记录提交点）
		//latest 从最新的开始（记录提交点）
		//none 报错
		prop.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest");
		
		//模拟多消费者在同一个消费者分组里G2
		prop.put(ConsumerConfig.GROUP_ID_CONFIG, "G2");
		for (int i = 0; i < 3; i++) {
			new Thread(new Runnable() {
				@Override
				public void run() {
					KafkaConsumer<String, String> consumer = new KafkaConsumer<>(prop);
					consumer.subscribe(Collections.singleton("kb09two"));
					while (true){
						ConsumerRecords<String, String> poll = consumer.poll(100);
						for (ConsumerRecord<String,String> record:
								poll) {
							System.out.println(Thread.currentThread().getName()+"\t"+record.offset() + "\t" + record.key() + "\t" + record.value());

						}
					}
				}
			}).start();
		}
	}
}