Flink基础系列13-Source之从Kafka读取

最新推荐文章于 2024-07-21 18:22:05 发布

只是甲

最新推荐文章于 2024-07-21 18:22:05 发布

阅读量1w

点赞数

分类专栏：大数据和数据仓库 # Flink 文章标签： kafka flink big data

本文链接：https://blog.csdn.net/u010520724/article/details/120866370

版权

大数据和数据仓库同时被 2 个专栏收录

290 篇文章 110 订阅

订阅专栏

Flink

43 篇文章 13 订阅

订阅专栏

本文介绍了如何在CDH6.3集群上使用Flink和Kafka进行数据处理。首先展示了Kafka生产者的代码，该生产者连接到指定的Kafka服务器并发送消息。接着，给出了Flink源代码，该代码创建了一个FlinkKafkaConsumer从Kafka的'sensor3'主题中读取数据并打印。最后，提供了打包和执行Flink程序的命令。

摘要由CSDN通过智能技术生成

一.环境介绍

环境介绍
本地测试环境搭建了CDH 6.3集群，集成了Kafka和Flink

Maven配置
从官网找到的maven配置如下:

<dependency>
  <groupId>org.apache.flink</groupId>
  <artifactId>flink-connector-kafka_2.11</artifactId>
  <version>1.9.0</version>
</dependency>

二.代码

kafka_producer

package org.example;

/**
 * @author  只是甲
 * @date    2021-08-30
 * @remark  kafka生产者
 */

import java.util.Properties;
import java.util.Random;

import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.ProducerConfig;
import org.apache.kafka.clients.producer.ProducerRecord;
import org.apache.kafka.common.serialization.StringSerializer;


public class kafka_producer {
    public static String topic = "sensor3";//定义主题

    public static void main(String[] args) throws Exception {
        Properties p = new Properties();
        p.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, "10.31.1.124:9092,10.31.1.125:9092,10.31.1.126:9092");//kafka地址，多个地址用逗号分割
        p.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, StringSerializer.class);
        p.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG, StringSerializer.class);
        KafkaProducer<String, String> kafkaProducer = new KafkaProducer<>(p);

        try {
            while (true) {
                String msg = "Hello," + new Random().nextInt(100);
                ProducerRecord<String, String> record = new ProducerRecord<String, String>(topic, msg);
                kafkaProducer.send(record);
                System.out.println("消息发送成功:" + msg);
                Thread.sleep(10000);
            }
        } finally {
            kafkaProducer.close();
        }

    }
}

SourceTest3_Kafka

package org.example;

/*
  @author  只是甲
 * @date    2021-08-30
 * @remark  Flink Souce之Kafka
 */

import org.apache.flink.api.common.serialization.SimpleStringSchema;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.connectors.kafka.FlinkKafkaConsumer;
import java.util.Properties;

import org.apache.flink.streaming.connectors.kafka.FlinkKafkaConsumerBase;


public class SourceTest3_Kafka {
    public static void main(String[] args) throws Exception{
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(1);

        Properties properties = new Properties();
        properties.setProperty("bootstrap.servers", "10.31.1.124:9092,10.31.1.125:9092,10.31.1.126:9092");
        properties.setProperty("group.id", "consumer-group");
        properties.setProperty("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
        properties.setProperty("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
        properties.setProperty("auto.offset.reset", "latest");

        // 从Kafka读取数据
        DataStream<String> dataStream = env.addSource( new FlinkKafkaConsumer<String>("sensor3", new SimpleStringSchema(), properties));


        // 打印输出
        dataStream.print();

        env.execute();
    }

}

三.打包代码并执行

运行命令:

flink run -m yarn-cluster -c org.example.SourceTest3_Kafka FlinkStudy-1.0-SNAPSHOT.jar

本地运行截图:

远程执行:
因为远程执行没有输出，这个地方不太好显示，略过

参考:

https://ci.apache.org/projects/flink/flink-docs-release-1.9/zh/dev/connectors/kafka.html
https://blog.csdn.net/u013411339/article/details/103018379

只是甲

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录