SparkStreaming中使用DataFrame和SQL操作

最新推荐文章于 2023-07-28 14:39:13 发布

神之凝视

最新推荐文章于 2023-07-28 14:39:13 发布

阅读量757

点赞数

分类专栏： Spark 流计算大数据文章标签： spark

本文链接：https://blog.csdn.net/qq_27600723/article/details/107316301

版权

一.简介

可以轻松地对流数据使用DataFrames和SQL操作。StreamingContext和其使用的SparkContext必须来自同一个SparkSession。以便可以在驱动程序故障时重新启动它。这是通过创建SparkSession的延迟实例化单例实例来完成的。在下面的示例中，修改了前面的单词计数示例，以使用DataFrames和SQL生成单词计数。每个RDD都转换为一个DataFrame，注册为临时表，然后使用SQL查询。

二.代码实战

package spark2.streaming

import org.apache.log4j.{
   Level, Logger}
import org.apache.spark.sql.SparkSession
import org.apache.spark.streaming.{
   Seconds, StreamingContext}

/**
  * 实时统计
  * Created by Administrator on 2020/07/13.
  */
object WordCountByForeachRDD {
   
  Logger.getLogger(

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

神之凝视

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
SparkStreaming中使用DataFrame和SQL操作

一.简介可以轻松地对流数据使用DataFrames和SQL操作。StreamingContext和其使用的SparkContext必须来自同一个SparkSession。以便可以在驱动程序故障时重新启动它。这是通过创建SparkSession的延迟实例化单例实例来完成的。在下面的示例中，修改了前面的单词计数示例，以使用DataFrames和SQL生成单词计数。每个RDD都转换为一个DataFrame，注册为临时表，然后使用SQL查询。二.代码实战package spark2.streamingim
复制链接

扫一扫