SparkStreaming测试

最新推荐文章于 2021-08-11 13:59:17 发布

weixin_30505485

最新推荐文章于 2021-08-11 13:59:17 发布

阅读量322

点赞数

文章标签： python

原文链接：http://www.cnblogs.com/energy1010/p/11179909.html

版权

sparkStream本地测试

1. nc -lk 9999 启动服务端，然后启动 network_wordcount.py，终端输出每秒的streaming数据流

2. 在服务端输入数据，客户端就能显示结果

完整代码如下

from __future__ import print_function

import sys 

from pyspark import SparkContext
from pyspark.streaming import StreamingContext

if __name__ == "__main__":
    if len(sys.argv) != 3:
        print("Usage: network_wordcount.py <hostname> <port>", file=sys.stderr)
        sys.exit(-1)
    sc = SparkContext(appName="PythonStreamingNetworkWordCount")
    ssc = StreamingContext(sc, 1)

    lines = ssc.socketTextStream(sys.argv[1], int(sys.argv[2]))
    counts = lines.flatMap(lambda line: line.split(" "))\
                  .map(lambda word: (word, 1))\
                  .reduceByKey(lambda a, b: a+b)
    print("log test")

    counts.pprint()
    ssc.start()
    ssc.awaitTermination()

转载于:https://www.cnblogs.com/energy1010/p/11179909.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30505485

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
SparkStreaming测试

sparkStream本地测试1. nc -lk 9999 启动服务端，然后启动 network_wordcount.py，终端输出每秒的streaming数据流2. 在服务端输入数据，客户端就能显示结果完整代码如下from __future__ import print_functionimport sys from pyspark imp...
复制链接

扫一扫