SparkStreaming - 自定义数据源(自定义采集器)

// 声明采集器
// 1)继承Receiver
// 2) 重写方法 onStart,onStop

package date_10_16_SparkStreaming

import java.io.{BufferedReader, InputStreamReader}
import java.net.Socket

import org.apache.spark.SparkConf
import org.apache.spark.storage.StorageLevel
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.streaming.receiver.Receiver

object MyReceiver{

    def main(args: Array[String]): Unit = {
      //使用SparkStreaming完成wordcount

      //配置对象
      val conf = new SparkConf().setMaster("local[*]").setAppName("wordcount")

      //实时数据分析的环境对象
      //StreamingContext需要两个参数,一个conf,一个是采集周期
      val streamingContext = new StreamingContext(conf,Seconds(5))

      //从指定的端口中采集数据
      val socketLineDstream = streamingContext.receiverStream(new MyReceiver1("chun1",9999))

      //将采集的数据进行分解(扁平化)
      val wordToSumDstream = socketLineDstream.flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_)

      wordToSumDstream.print()

      //这里不能停止采集功能,也就是streamingContext不能结束
      //可以简单理解为启动采集器
      streamingContext.start()
      //Driver等待采集器,采集器不挺Driver不停止
      streamingContext.awaitTermination()
    }

}

// 声明采集器
// 1)继承Receiver
// 2) 重写方法 onStart,onStop
class MyReceiver1(host:String,port:Int) extends Receiver[String](StorageLevel.MEMORY_ONLY){

  var socket : Socket = null

  def receive(): Unit = {
    socket = new Socket(host,port)
    val reader = new BufferedReader(new InputStreamReader(socket.getInputStream,"UTF-8"))
    
    var line : String = null
    
    while ((line = reader.readLine()) != null){
      //将采集器的数据存储到采集器内部进行转换
      if ("END".equals(line)){
        return
      }else{
        this.store(line)
      }
    }
  }
  override def onStart(): Unit = {
    new Thread(new Runnable {
      override def run(): Unit = {
          receive()
      }
    }).start()
  }

  override def onStop(): Unit = {
    if (socket !=null){
      socket.close()
      socket = null
    }
  }
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值