Spark JDBC RDD

最新推荐文章于 2021-03-17 06:12:45 发布

Claroja

最新推荐文章于 2021-03-17 06:12:45 发布

阅读量187

点赞数

文章标签： Spark

本文链接：https://blog.csdn.net/claroja/article/details/102680036

版权

package spark

import java.sql.{DriverManager}

import org.apache.spark.rdd.{JdbcRDD, RDD}
import org.apache.spark.{SparkConf, SparkContext}
object JdbcRddDemo {
  val getConn = () => {
    DriverManager.getConnection("jdbc:mysql://localhost:3306/bigdata?characterEncoding=UTF-8", "root", "111111")
  }

  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setAppName("JdbcRddDemo").setMaster("local[*]")
    val sc = new SparkContext(conf)
    val jdbcRDD: RDD[(Int, String, Int)] = new JdbcRDD( //这个RDD从数据库里读取数据
      sc,
      getConn,
      "SELECT * FROM logs WHERE id >= ? AND id <= ?", //每个RDD都会执行分割后相同的sql语句,要用全闭区间,不然分割时丢数据
      1,
      5,
      2, //分区数量
      rs => {
        val id = rs.getInt(1)
        val name = rs.getString(2)
        val age = rs.getInt(3)
        (id, name, age)
      }
    )
    val r = jdbcRDD.collect()
    println(r.toBuffer)
    sc.stop()
  }
}

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Claroja

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark JDBC RDD

package sparkimport java.sql.{DriverManager}import org.apache.spark.rdd.{JdbcRDD, RDD}import org.apache.spark.{SparkConf, SparkContext}object JdbcRddDemo { val getConn = () => { DriverM...
复制链接

扫一扫