Spark Streaming-Kafka实例(Python与Java版本)

最新推荐文章于 2024-01-21 03:37:56 发布

hadoove

最新推荐文章于 2024-01-21 03:37:56 发布

阅读量980

点赞数

分类专栏： python java 大数据架构大数据文章标签： spark Streaming kafka spark streaming createDirectStream

本文链接：https://blog.csdn.net/u013817676/article/details/81774543

版权

本文详细介绍了如何使用Java实现Kafka producer和Python实现Spark Streaming consumer进行通信。内容涵盖Kafka和Spark Streaming环境的安装，以及通过createStream和createDirectStream两种方式在本地单机环境下建立二者连接的实践。

摘要由CSDN通过智能技术生成

本文实现kafka与Spark Streaming之间的通信，其中Kafka端producer实现使用Java，Spark Streaming端Consumer使用Python实现。

首先安装kafka与spark streaming环境，kafka测试连通测试参考上文，本文的实验环境都为本地单机版本。

Kafka

import org.apache.kafka.clients.producer.*;
import org.apache.kafka.common.serialization.StringSerializer;
import java.util.Properties;

public class producer {
   
    private final static String TOPIC = "data-message";
    private final static String BOOTSTRAP_SERVER = "127.0.0.1:9092";


    public static Producer<String,String> createProducer() {
        Properties props = new Properties();
        props.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG,BOOTSTRAP_SERVER);
        props.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, StringSerializer.class.getName());
        props.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG, StringSerializer.class.getName());

        return new KafkaProducer<>(props);
    }

    // 实现自定义partition
    public

最低0.47元/天解锁文章

hadoove

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Spark Streaming-Kafka实例(Python与Java版本)

本文实现kafka与Spark Streaming之间的通信，其中Kafka端producer实现使用Java，Spark Streaming端Consumer使用Python实现。首先安装kafka与spark streaming环境，kafka测试连通测试参考上文，本文的实验环境都为本地单机版本。Kafkaimport org.apache.kafka.clients.produc...
复制链接

扫一扫

专栏目录