sparkstreaming的reduceByKeyAndWindow窗口函数的实现搜索热词排名

最新推荐文章于 2023-05-21 21:21:56 发布

qq_41945142

最新推荐文章于 2023-05-21 21:21:56 发布

阅读量271

点赞数 1

分类专栏： Spark 文章标签： SparkStreaming reduceByKeyAndWindow

本文链接：https://blog.csdn.net/qq_41945142/article/details/100109749

版权

代码实现如下：

import org.apache.spark.SparkConf
import org.apache.spark.streaming.dstream.{DStream, ReceiverInputDStream}
import org.apache.spark.streaming.{Seconds, StreamingContext}

//搜索热词前三，实现实时计算
object WindowScala {
  def main(args: Array[String]): Unit = {


    val conf = new SparkConf().setMaster("local[2]").setAppName("WindowScala")
    val ssc: StreamingContext = new StreamingContext(conf, Seconds(1))
    //获取数据，数据格式为（客户识别信息 搜索内容）
    val ReceiverDStreamInput: ReceiverInputDStream[String] = ssc.socketTextStream("Hadoop01", 9999)
    //将数据进行转化，转化成（搜索内容，1）
    val Dstream = ReceiverDStreamInput.map(line => (line.split(" ")(1), 1))
    //    对数据做reduceByKeyAndWindow操作，对相同的key，按照value求和，窗口长度为30s，每隔10s生成一个窗口
    val windowResults: DStream[(String, Int)] = Dstream.reduceByKeyAndWind

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qq_41945142

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
sparkstreaming的reduceByKeyAndWindow窗口函数的实现搜索热词排名

代码实现如下：import org.apache.spark.SparkConfimport org.apache.spark.streaming.dstream.{DStream, ReceiverInputDStream}import org.apache.spark.streaming.{Seconds, StreamingContext}//搜索热词前三，实现实时计算ob...
复制链接

扫一扫