Spark Streaming 1:入门程序windows或linux下监听端口或本地目录的wordcount

本文介绍了如何使用Spark Streaming在Linux环境下监听端口9999进行WordCount操作,以及通过配置SparkContext实现本地目录监听。在Linux下,通过nc命令发送数据到端口,Spark Streaming每10秒执行一次计算。同时,文章讨论了监听本地目录的情况,指出手动复制文件无法触发计算,但可以通过代码方式在目录中创建文件以实现监听。
摘要由CSDN通过智能技术生成

Spark Streaming Programming Guide  1.6.2官方指导

http://spark.apache.org/docs/1.6.2/streaming-programming-guide.html


Spark Streaming可以监听本地文件、HDFS、端口、flume、kafka等。


 Linux下监听端口9999实现wordcount:

1.代码实现

配置SparkContext时,需要‘local[2]’,因为需要两个线程,一个端口监听一个计算

每十秒进行一次计算

#------------------------------word count----
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值