SparkStreaming整合mysql

最新推荐文章于 2023-12-10 11:13:46 发布

luoyunfan6

最新推荐文章于 2023-12-10 11:13:46 发布

阅读量673

点赞数 1

分类专栏： spark基础文章标签： streaming mysql

本文链接：https://blog.csdn.net/luoyunfan6/article/details/103094986

版权

测试过程：

1.向虚拟机mini1的7777端口发送一个个的单词信息
2.Streaming程序接受7777端口的数据，并做处理。
3.将DStream[(String, Int)]转化成RDD写入到mysql

程序如下：

package spark.SparkStreaming.file
import java.sql.DriverManager
import org.apache.spark.SparkContext
import org.apache.spark.sql.SparkSession
import org.apache.spark.streaming.{Seconds, StreamingContext}
object streaming2Mysql {
  def main(args: Array[String]): Unit = {
      //SparkSession
      val spark: SparkSession = SparkSession.builder()
        .appName(streaming2Mysql.getClass.getSimpleName)
        .master("local[*]")
        .getOrCreate()
      val sc: SparkContext = spark.sparkContext
      val ssc: StreamingContext = new StreamingContext(sc, Seconds(2))
      ssc.checkpoint("file:///C:\\ck")
      //DStream,迭代计算,并显示内容
      ssc.socketTextStream("mini1", 7777)
        .flatMap(_.split("\\s+"))
        .filter(_.nonEmpty)
        .map((_, 1))
        .updateStateByKey((nowBatch: Seq[Int], historyResult: Option[Int]) => Some(nowBatch.sum + historyResult.getOrElse(0)))
        .foreachRDD(rdd => {
          if (!rdd.isEmpty()) {
            rdd.foreachPartition(itr => {
              if (!itr.isEmpty) {
                itr.foreach(perEle => {
                  val word = perEle._1
                  val cnt = perEle._2
                  save2DB(word, cnt)
                })
              }
            })
          }
        })

      //启动SparkStreaming应用
      ssc.start
      //等待结束（必须要添加）
      ssc.awaitTermination
    }
    /**
      * 保存到DB中
      * @param word
      * @param cnt
      */
      
    def save2DB(word: String, cnt: Int) = {
      //加载驱动
      classOf[com.mysql.

最低0.47元/天解锁文章

luoyunfan6

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
SparkStreaming整合mysql

测试过程：1.向虚拟机mini1的7777端口发送一个个的单词信息2.Streaming程序接受7777端口的数据，并做处理。3.将DStream[(String, Int)]转化成RDD写入到mysql程序如下：package spark.SparkStreaming.fileimport java.sql.DriverManagerimport org.apache.spar...
复制链接

扫一扫

专栏目录