sparkstreaming本地读取数据获取不到内容

本文探讨了在SparkStreaming中遇到的本地数据读取问题,原因在于本地文件系统的操作与HDFS的流式操作不同。为解决此问题,文章提供了相应的文件写入代码示例,确保数据能被SparkStreaming正确捕获。
摘要由CSDN通过智能技术生成

代码

sparkstreaming本地读取数据代码块

package com.mydemo

import org.apache.spark.SparkConf
import org.apache.spark.streaming.dstream.DStream
import org.apache.spark.streaming.{Seconds, StreamingContext}

object strDemo {

  def main(args: Array[String]): Unit = {

    //1.初始化Spark配置信息
    val sparkConf = new SparkConf().setMaster("local[*]")
      .setAppName("StreamWordCount")

    //2.初始化SparkStreamingContext,间隔时间
    val ssc = new StreamingContext(sparkConf, Seconds(5))

    //3.监控文件夹
    val dirStream = ssc.textFileStream("file:///C:/User/IdeaProjects/spark01/")

    //4.将数据进行切分
    val wordStreams: DStream[String] = dirStream.flatMap(_.split(","))

    //5.将切割后的数据转换为(数据,1)的二元组格式
    val wordAndOneStreams = wordStreams.map((_, 1))

    //6.通过二元组中相同key的数据求和
    val wordAndCountStreams = wordAndOneStreams.reduceByKey(_ + _)

    //7.打印
    wordAndCountStreams.print()

    /
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值