Spark Streaming 本地测试:读取Windows本地文本文件

本文介绍了如何在Windows环境下使用Spark Streaming进行本地测试,包括通过socketTextStream方法监听端口读取文本和使用textFileStream方法监听文件夹。在测试时,需确保程序先启动并监听,然后发送数据。对于socketTextStream,可以使用netcat工具打开端口,通过命令行输入或导入文本;对于textFileStream,需要注意文件必须在监听开始后进行最后一次更改并保存,才能被检测到。
摘要由CSDN通过智能技术生成

Spark Streaming 本地测试

准备工作就不说了,网上一大堆,jdk,sdk,环境搭建。。。
直接进入正题

本地idea Spark Streaming 读取 Windows本地文本文件两种方法:

先提一下:测试前,请先写好SparkStreaming程序,并且跑起来,让它开始监听,然后你再传数据,不然你传了数据之后,再开监听,还监听个毛啊

(1)通过ssc的socketTextStream()方法,读取本地某个端口的数据:
    在cmd命令行中通过netcat 打开端口(没有装netcat的话,就去装一下吧,很有用,而且才100k不到,很小的),可以向规定端口中手动输入文本,也可以将已存在的文本传入该端口(端口内部其实就是读取了该文本的内容)

    对端口的操作(在cmd中输入)
①nc -l -p 7777
//打开端口,可以向端口中输入文本
②nc -l -p 7777 < c:/test.log
//向端口里传文本 (那个符号是小于号,小于号两边都要加空格哦,如果文件路径不对,会给出提示的,仔细修改就行了)

● 补充:向端口传入文本的方法有一个小问题,就是端口不会读取到该文本最后一行的内容,所以,为了保证文本内容完整地被读取到,可以在文本内容最后再换一行,这样没被读取到的内容其实就是最后那个空的一行了

SparkConf 等 的设置&#

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值