SparkStream流处理入门

依赖

根据scala版本选择

    <dependency>
      <groupId>org.apache.spark</groupId>
      <artifactId>spark-streaming_2.12</artifactId>
      <version>3.1.1</version>
    </dependency>

1. 单词统计

1.1 spark处理代码
package ace.gjh.streaming

import org.apache.spark.SparkConf
import org.apache.spark.streaming.{Duration, StreamingContext}

/**
 * Spark流式计算-单词计数<br>
 * 数据源:nc
 * 
 * @author ACE_GJH
 * @date 2021/5/5
 */
object StreamingWordCount {
  def main(args: Array[String]): Unit = {
    // 创建Spark流式计算配置
    val conf = new SparkConf()
      .setAppName("Streaming-WordCount")
      .setMaster("local[*]")
    val context = new StreamingContext(conf, new Duration(2000))
    // 设置日志的输出级别
    context.sparkContext.setLogLevel("ERROR")
    val stream = context.socketTextStream("localhost", 9999)
    stream
      .flatMap(_.split(" "))
      .map((_, 1))
      .groupByKey()
      .map(t => (t._1, t._2.size))
      .print(20)
    // 开启流应用
    context.start()
    // 关闭资源
    context.awaitTermination()
  }
}
1.2 数据源
nc -lk 9999

2. 单词统计排行榜

2.1 spark处理代码
package ace.gjh.streaming

import org.apache.spark.SparkConf
import org.apache.spark.streaming.{Duration, Seconds, StreamingContext}

/**
 * Spark流式计算-单词计数<br>
 * 数据源:nc
 *
 * @author ACE_GJH
 * @date 2021/5/5
 */
object StreamingWordCountAndWindow {
  def main(args: Array[String]): Unit = {
    // 创建Spark流式计算配置
    val conf = new SparkConf()
      .setAppName("Streaming-WordCount")
      .setMaster("local[*]")
    val context = new StreamingContext(conf, new Duration(1000))
    // 设置日志的输出级别
    context.sparkContext.setLogLevel("ERROR")
    val stream = context.socketTextStream("localhost", 9999)
    stream
      .flatMap(_.split(" "))
      .map((_, 1))
      .window(Seconds(15))
      .groupByKey()
      .map(t => (t._1, t._2.size))
      .foreachRDD(rdd => {
        val tuples = rdd
          .sortBy(_._2, false, 1)
          .take(3)
        for (elem <- tuples) {
          println(elem._1 + " " + elem._2)
        }
      })
    // 开启流应用
    context.start()
    // 关闭资源
    context.awaitTermination()
  }
}
2.2 数据源
nc -lk 9999
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

郭建華

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值