【Spark】Spark常用方法总结4-SparkStreaming（Python版本）

最新推荐文章于 2024-05-10 22:51:01 发布

「已注销」

最新推荐文章于 2024-05-10 22:51:01 发布

阅读量431

点赞数

分类专栏： Spark 文章标签： spark 大数据 hadoop

本文链接：https://blog.csdn.net/refbit/article/details/104109189

版权

本文总结了SparkStreaming在Python中的使用，包括SparkStreamingContext的创建、报错解决方法，如需确保分配的核心数大于接收器数量。还介绍了基本源和高级源，如文件系统、套接字连接、Kafka等，提醒Python使用者相关资料可能主要基于Scala。

摘要由CSDN通过智能技术生成

SparkStreamingContext

spark = SparkSession.builder.appName('test').master('local[*]').getOrCreate()

ss = StreamingContext(spark.sparkContext, 10)
lines = ss.socketTextStream('10.255.77.183', 10086)
result = lines.flatMap(lambda x: x.split(' ')).map(lambda x: (x, 1)).reduceByKey(lambda x1, x2: x1 + x2

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

「已注销」

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【Spark】Spark常用方法总结4-SparkStreaming（Python版本）

SparkStreamingContextspark = SparkSession.builder.appName('test').master('local[*]').getOrCreate()ss = StreamingContext(spark.sparkContext, 10)lines = ss.socketTextStream('10.255.77.183', 10086)r...
复制链接

扫一扫