pyspark kafka mysql_Pyspark 从kafka 读取数据 rdd，转成 DataFrame

最新推荐文章于 2022-04-24 09:04:27 发布

烛煌

最新推荐文章于 2022-04-24 09:04:27 发布

阅读量250

点赞数

文章标签： pyspark kafka mysql

本文链接：https://blog.csdn.net/weixin_34775101/article/details/114358231

版权

from __future__ import print_function

import sys

import json

from pyspark import SparkContext

from pyspark.streaming import StreamingContext

from pyspark.streaming.kafka import KafkaUtils

from pyspark.sql import Row, SparkSession

def getSparkSessionInstance(sparkConf):

# 生成单例模式的getSparkSessionInstance

if ('sparkSessionSingletonInstance' not in globals()):

globals()['sparkSessionSingletonInstance'] = SparkSession

.builder

.config(conf=sparkConf)

.getOrCreate()

return globals()['sparkSessionSingletonInstance']

sc = SparkContext("local[2]","NetWordCount")

ssc = StreamingContext(sc,1)

topic = "connect-test"

# kafka 中的 topic

kvs = KafkaUtils.createStream(ssc,"localhost:2181","spark-streaming-consumer",

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注