foreachrdd写入mysql_foreachRDD操作检查点与数据写入到sql

最新推荐文章于 2022-03-07 17:36:23 发布

EHSer

最新推荐文章于 2022-03-07 17:36:23 发布

阅读量143

点赞数

文章标签： foreachrdd写入mysql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_33129093/article/details/113900834

版权

package com.day16

import com.day15.ConnectionPoolUtil

import org.apache.spark.streaming.dstream.{DStream, ReceiverInputDStream}

import org.apache.spark.streaming.kafka.KafkaUtils

import org.apache.spark.{HashPartitioner, SparkConf}

import org.apache.spark.streaming.{Seconds, StreamingContext}

/**

* foreachRDD操作

*/

object updateStateByKeyJDBC {

val updateFunc = (ite:Iterator[(String, Seq[Int], Option[Int])]) => {

ite.map(t=>(t._1,t._2.sum + t._3.getOrElse(0)))

}

def main(args: Array[String]): Unit = {

val conf = new SparkConf().setAppName("ysbj").setMaster("local[2]")

val ssc = new StreamingContext(conf,Seconds(5))

// 先写一个检查点

ssc.checkpoint("hdfs://node1:9000/checkpoint")

// 编写一些基本的配置信息

// 配置连接Kafka信息

val zks = "192.168.28.131:2181,192.168.28.131:2182,192.168.28.131:2183"

// kafka 消费组

val groupId = "gp1"

// 配置Kafka基本信息

val topics = Map[String,Int]("test1"->1)

// 创建数据流

val data: ReceiverInputDStream[(String, String)] = KafkaUtils.createStream(ssc,zks,groupId,topics)

// 将结果集合统计

val words: DStream[(String, Int)] = data.flatMap(_._2.split(" ")).map((_,1))

// 应用到UpdateStateByKey

val value = words.updateStateByKey(updateFunc,new HashPartitioner(ssc.sparkContext.defaultParallelism),true)

// 将数据存入mysql数据库

value.foreachRDD(f=>{

f.foreachPartition(f=>{

// 获取jdbc连接

val conn = ConnectionPoolUtil.getConnections

f.foreach(f=>{

// 执行插入语句(SQL)

val sql = "insert into streaming(word,count)" +

"values('"+f._1+"',"+f._2+")"

val stmt = conn.createStatement()

stmt.executeUpdate(sql)

})

ConnectionPoolUtil.returnConn(conn)

})

})

// 启动

ssc.start()

ssc.awaitTermination()

}

}

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
foreachrdd写入mysql_foreachRDD操作检查点与数据写入到sql

package com.day16import com.day15.ConnectionPoolUtilimport org.apache.spark.streaming.dstream.{DStream, ReceiverInputDStream}import org.apache.spark.streaming.kafka.KafkaUtilsimport org.apache.spark.{...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。