scala写入mysql_Spark将计算结果写入到Mysql中

最新推荐文章于 2022-06-12 01:25:03 发布

苏瑾青

最新推荐文章于 2022-06-12 01:25:03 发布

阅读量320

点赞数

文章标签： scala写入mysql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_31430653/article/details/111958422

版权

在《Spark与Mysql(JdbcRDD)整合开发》文章中我们介绍了如何通过 /**

* User: 过往记忆

* Date: 15-03-10

* Time: 上午07:30

* bolg:

* 本文地址：/archives/1275

* 过往记忆博客，专注于hadoop、hive、spark、shark、flume的技术博客，大量的干货

* 过往记忆博客微信公共帐号：iteblog_hadoop

*/

package scala

import java.sql.{DriverManager, PreparedStatement, Connection}

import org.apache.spark.{SparkContext, SparkConf}

object RDDtoMysql {

case class Blog(name: String, count: Int)

def myFun(iterator: Iterator[(String, Int)]): Unit = {

var conn: Connection = null

var ps: PreparedStatement = null

val sql = "insert into blog(name, count) values (?, ?)"

try {

conn = DriverManager.getConnection("jdbc:mysql://localhost:3306/spark",

"root", "123456")

iterator.foreach(data => {

ps = conn.prepareStatement(sql)

ps.setString(1, data._1)

ps.setInt(2, data._2)

ps.executeUpdate()

}

)

} catch {

case e: Exception => println("Mysql Exception")

} finally {

if (ps != null) {

ps.close()

}

if (conn != null) {

conn.close()

}

}

}

def main(args: Array[String]) {

val conf = new SparkConf().setAppName("RDDToMysql").setMaster("local")

val sc = new SparkContext(conf)

val data = sc.parallelize(List(("www", 10), ("iteblog", 20), ("com", 30)))

data.foreachPartition(myFun)

}

}

其实是通过foreachPartition遍历RDD的每个分区，并调用普通的Scala方法来写数据库。在运行程序之前需要确保数据库里面存在blog表，可以通过下面语句创建： CREATE TABLE `blog` (

`name` varchar(255) NOT NULL,

`count` int(10) unsigned DEFAULT NULL

) ENGINE=InnoDB DEFAULT CHARSET=utf-8

然后直接运行上述的代码即可。运行完成你就可以在数据库里面查询结果： SELECT * FROM blog b;

www　　10

iteblog　　20

com　　30

需要注意的是：

1、你最好使用forEachPartition 函数来遍历RDD，并且在每台Work上面创建数据库的connection。

2、如果你的数据库并发受限，可以通过控制数据的分区来减少并发。

3、在插入Mysql的时候最好使用批量插入。

4、确保你写入数据库过程能够处理失败，因为你插入数据库的过程可能会经过网络，这可能会导致数据插入到数据库失败。

5、不建议将你的RDD数据写入到Mysql等关系型数据库中。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
scala写入mysql_Spark将计算结果写入到Mysql中

在《Spark与Mysql(JdbcRDD)整合开发》文章中我们介绍了如何通过 /*** User: 过往记忆* Date: 15-03-10* Time: 上午07:30* bolg:* 本文地址：/archives/1275* 过往记忆博客，专注于hadoop、hive、spark、shark、flume的技术博客，大量的干货* 过往记忆博客微信公共帐号：iteblog_hadoop*/pac...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。