Spark读取Mysql数据 JdbcRDD方式

最新推荐文章于 2022-06-12 01:25:03 发布

半醒半醉日复日花落花开年复年

最新推荐文章于 2022-06-12 01:25:03 发布

阅读量494

点赞数 1

文章标签： spark mysql

本文链接：https://blog.csdn.net/weixin_42469955/article/details/104496313

版权

本文介绍了如何利用Spark的JdbcRDD类通过指定的SQL查询从MySQL数据库中读取数据。主要内容包括理解JdbcRDD的参数，如SparkContext、获取Connection的方法、SQL查询语句、数据范围及分区数量，并提供了回调方法对查询结果集进行处理的示例。

摘要由CSDN通过智能技术生成

用JdbcRDD方式读MySQL数据
咱们先来看下他的源码主要看下它的参数：
在这里插入图片描述
下面是对参数的解释：
sc: SparkContext, // 这个是上下文的环境对象
getConnection: () => Connection, //这里是个无参函数返回Connection
sql: String, // 这个是自己写的sql
lowerBound: Long, // 指的是数据的范围数据上限
upperBound: Long, // 指的是数据的范围数据下限
numPartitions: Int, // 分区的数量
mapRow: (ResultSet) => T = JdbcRDD.resultSetToObjectArray _) // 回调方法当你的查询结果集回来后你怎么样对他操作处理

下面是具体代码和解释：

package xxx

import java.sql.DriverManager

import org.apache.spark.rdd.JdbcRDD
import org.apache.spark.{SparkConf, SparkContext}


object MysqlDemo {


  def main(args: Array[String]): Unit = {

   // 创建Spark配置对象
    val conf = new SparkConf().setAppName(this.getClass.getSimpleName.filter(!_.equals('$'