SparkStreaming《三》读取kafka数据，增量保存在Mysql里

最新推荐文章于 2021-09-14 10:17:41 发布

sinat_32176267

最新推荐文章于 2021-09-14 10:17:41 发布

阅读量1.6k

点赞数

分类专栏：大数据文章标签： SparkStreaming kafka mysql

本文链接：https://blog.csdn.net/sinat_32176267/article/details/81871491

版权

本文介绍如何使用SparkStreaming从Kafka读取数据，并通过sbt打包程序，将数据增量保存到MySQL数据库中。详细步骤包括编写sbt配置、运行SparkSubmit以及检查MySQL中的数据填充情况。

摘要由CSDN通过智能技术生成

一、SparkStreaming读取kafka数据

package org.apache.spark.examples.streaming
import java.sql.{PreparedStatement, Connection, DriverManager}
import java.util.concurrent.atomic.AtomicInteger
import org.apache.spark.SparkConf
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.streaming.StreamingContext._
import org.apache.spark.storage.StorageLevel

object NetworkWordCountStateful {
  def main(args: Array[String]) {
    //定义状态更新函数
    val updateFunc = (values: Seq[Int], state: Option[Int]) => {
      val currentCount = values.foldLeft(0)(_ + _)
      val previousCount = state.getOrElse(0)
      Some(currentCount + previousCount)
    }
    StreamingExamples.setStreamingLogLevels()  //设置log4j日志级别
    val conf = new SparkConf().setMaster("local[2]").setAppName("NetworkWordCountStateful")
    val sc = new StreamingContext(conf, Seconds(5))
    sc.checkpoint("file:///usr/local/spark/mycode/streaming/dstreamoutput/")    //设置检查点，检查点具有容错机制
    val lines = sc.socketTextStream("localhost", 9999)
    val words = lines.flatMap(_.split(" "))
    val wordDstream = words.map(x => (x, 1))
    val stateDstream = wordDstream.updateStateByKey[Int](updateFunc)
    stateDstream.print()
        //下面是新增的语句，把DStream保存到MySQL数据库中     
     stateDstream.foreachRDD(rdd => {
      //内部函数
      def func(records: Iterator[(String,Int)]) {
        var conn: Connection = null

最低0.47元/天解锁文章

sinat_32176267

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
SparkStreaming《三》读取kafka数据，增量保存在Mysql里

一、SparkStreaming读取kafka数据package org.apache.spark.examples.streamingimport java.sql.{PreparedStatement, Connection, DriverManager}import java.util.concurrent.atomic.AtomicIntegerimport org.apach...
复制链接

扫一扫

专栏目录