10.4 spark2 structured streaming 实时计算hdfs文件输入流cdh

最新推荐文章于 2022-10-02 14:25:22 发布

我的海_

最新推荐文章于 2022-10-02 14:25:22 发布

阅读量858

点赞数 1

本文链接：https://blog.csdn.net/kk25114/article/details/98777468

版权

继上一篇spark2.4 cdh

演示:实时监控hdfs

a.文件1

b.添加文件

代码

import org.apache.spark.sql.SparkSession
import org.apache.spark.sql.types.StructType

object FileInputStructuredStreaming {
  def main(args: Array[String]): Unit = {
    val spark = SparkSession
      .builder
      .master("local")
      .appName("StructuredNetworkWordCount")
      .getOrCreate()

    spark.sparkContext.setLogLevel("WARN")

    import spark.implicits._
    val userSchema = new StructType().add("name", "string").add("age", "integer")
    val lines = spark.readStream
      .option("sep", ";")
      .schema(userSchema)
      .csv("hdfs://192.168.50.135:8020/user/hdfs/yanke_data/data3/")

    val query = lines.writeStream
      .outputMode("append")
      .format("console")
      .start()

    query.awaitTermination()
  }
}

kafka

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

我的海_

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
10.4 spark2 structured streaming 实时计算hdfs文件输入流cdh

继上一篇spark2.4 cdh演示:实时监控hdfsa.文件1b.添加文件代码import org.apache.spark.sql.SparkSessionimport org.apache.spark.sql.types.StructTypeobject FileInputStructuredStreaming { de...
复制链接

扫一扫