kafka（六）：java API消费数据_java 优雅的连接kafka 消费数据-CSDN博客

本文链接：https://blog.csdn.net/qq_22973811/article/details/126891724

文章目录

说明
分享
kafka消费实现
总结

说明

kafka消费消息记录。

大数据博客列表
开发记录汇总
个人java工具库项目https://gitee.com/wangzonghui/object-tool
- 包含json、string、集合、excel、zip压缩、pdf、bytes、http等多种工具，欢迎使用。

kafka消费实现

maven

<dependency>  
    <groupId>org.apache.kafka</groupId>  
    <artifactId>kafka-clients</artifactId>  
    <version>2.3.0</version>  
</dependency>
<!-- 日志 -->
<dependency>
    <groupId>ch.qos.logback</groupId>
    <artifactId>logback-classic</artifactId>
    <version>1.2.11</version>
</dependency>

连接

连接并消费kafka

private Logger log= LoggerFactory.getLogger(this.getClass());
	
	/**
	 * kafka 连接地址
	 */
	public String bootstrapServer ="localhost:9092";
	
	/**
	 * topic
	 */
	public String topic="test1";
	
	
	public void kafkaDemo() {
	       Properties properties = new Properties();
	        //borker地址
	        properties.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG,bootstrapServer);
	        //反序列化方式
	        properties.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG,StringDeserializer.class.getName());
	        properties.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG,StringDeserializer.class.getName());
	        
	        //------------------消费组id必须指定----------------------------
	        //指定消费者组id
	        properties.put(ConsumerConfig.GROUP_ID_CONFIG,"group1");
	        
	        //earliest:offset偏移至最早时候开始消费；latest：偏移到从最新开始消费（默认） earliest 从最早位置消费消息
	        properties.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG,"earliest");		
	        
	        //每批次最小拉取数据大小,默认1byte
	        properties.put(ConsumerConfig.FETCH_MIN_BYTES_CONFIG,1);
	        
	        //每批次最大拉取数据大小，默认50M
	        properties.put(ConsumerConfig.FETCH_MAX_BYTES_CONFIG,50 * 1024 * 1024);
	        
	        //一批次数据，未达到最小数据大小时候，最大等待时间.默认500ms
	        properties.put(ConsumerConfig.FETCH_MAX_WAIT_MS_CONFIG,500);
	        
	        //单次调用 poll() 返回的最大记录数,默认500
	        properties.put(ConsumerConfig.MAX_POLL_RECORDS_CONFIG,500);
	        
	        KafkaConsumer<String,String> kafkaConsumer = new KafkaConsumer<>(properties);
	        
	        //A. 设置订阅的topic 列表，从所有数据分区读取数据
	        List<String> topicList = new ArrayList<>();
	        topicList.add(topic);
	        kafkaConsumer.subscribe(topicList);
	        
	        //B. 设置订阅topic，并指定分区
//	        List<TopicPartition> topicPartitions = new ArrayList<>();
//	        topicPartitions.add(new TopicPartition(topic,0));
//	        kafkaConsumer.assign(topicPartitions);
	        
	        try {
		        while (true){
		            ConsumerRecords<String,String> records = kafkaConsumer.poll(Duration.ofSeconds(2L));
		            for (ConsumerRecord<String,String> record : records) {
		                System.out.println("topic："+record.topic()+"|partition："+record.partition()+"|数据："+record.value());
		            }
		        }
		        
	        }catch(Exception e){
	        	log.error(e.toString(),e);
	        }finally {
	        	kafkaConsumer.close();
	        }
	}
	
	
	public static void main(String[] args) {
		new KafkaCustomer().kafkaDemo();;
	}

说明

注意设置消费位置，请按需选择
- earliest 偏移至最早时候开始消费，每次软件启动会从最开始位置消费，会有重复数据
- latest：偏移到从最新开始消费（默认），软件启动前kafka中数据不会被接收处理。
设置Topic支持分区指定，默认消费所有分区。
如需kerberos认证，参照 kafka（四）：kafka javaAPI入库程序