Spark读写MySQL与HBase

最新推荐文章于 2024-04-23 08:18:31 发布

Yuan_CSDF

最新推荐文章于 2024-04-23 08:18:31 发布

阅读量739

点赞数

分类专栏： # Spark基础

本文链接：https://blog.csdn.net/Yuan_CSDF/article/details/82756594

版权

Spark基础专栏收录该内容

17 篇文章 1 订阅

订阅专栏

1. MySQL读取

val sparkConf = new SparkConf().setMaster("local[2]").setAppName("JdbcApp")
val sc = new SparkContext(sparkConf)
val rdd = new org.apache.spark.rdd.JdbcRDD(sc, () => {
  Class.forName("com.mysql.jdbc.Driver").newInstance()
  java.sql.DriverManager.getConnection("jdbc:mysql://master01:3306/hive", "root", "123456")
},
  "select * from tableName where id >= ? and id <= ?;",
  1, 10, 1, r => (r.getInt(1), r.getString(2)))
println(rdd.count())
rdd.foreach(println(_))
sc.stop()

2.Mysql写入

 def main(args: Array[String]): Unit = {
  val sparkConf = new SparkConf().setMaster("local[2]").setAppName("HAppName")
  val sc = new SparkContext(sparkConf)
  val data = sc.parallelize(List("Female", "Male", "Female"))
  data.foreachPartition(insertData)
}

 def insertData(iterator: Iterator[String]): Unit = {
  Class.forName ("com.mysql.jdbc.Driver").newInstance()
  val conn = java.sql.DriverManager.getConnection("jdbc:mysql://master01:3306/hive", "root", "123456")
  iterator.foreach(data => { val ps = conn.prepareStatement("insert into tableName(name) values (?)")
    ps.setString(1, data)
    ps.executeUpdate()
  }) 
}

3.HBase 读取

val sparkConf = new SparkConf().setMaster("local[2]").setAppName("HBaseApp")
val sc = new SparkContext(sparkConf)
val conf = HBaseConfiguration.create()
//HBase中的表名
conf.set(TableInputFormat.INPUT_TABLE, "fruit")
val hBaseRDD = sc.newAPIHadoopRDD(conf, classOf[TableInputFormat],
  classOf[org.apache.hadoop.hbase.io.ImmutableBytesWritable],
  classOf[org.apache.hadoop.hbase.client.Result])
val count = hBaseRDD.count()
println("hBaseRDD RDD Count:" + count)
hBaseRDD.cache()
hBaseRDD.foreach {
  case (_, result) =>
    val key = Bytes.toString(result.getRow)
    val name = Bytes.toString(result.getValue("info".getBytes, "name".getBytes))
    val color = Bytes.toString(result.getValue("info".getBytes, "color".getBytes))
    println("Row key:" + key + " Name:" + name + " Color:" + color)
}
sc.stop()

4.HBase 写入

val sparkConf = new SparkConf().setMaster("local[2]").setAppName("HBaseApp")
val sc = new SparkContext(sparkConf)
val conf = HBaseConfiguration.create()
val jobConf = new JobConf(conf)
jobConf.setOutputFormat(classOf[TableOutputFormat])
jobConf.set(TableOutputFormat.OUTPUT_TABLE, "fruit_spark")
val fruitTable = TableName.valueOf("fruit_spark")
val tableDescr = new HTableDescriptor(fruitTable)
tableDescr.addFamily(new HColumnDescriptor("info".getBytes))
val admin = new HBaseAdmin(conf)
if (admin.tableExists(fruitTable)) {
  admin.disableTable(fruitTable)
  admin.deleteTable(fruitTable)
}
admin.createTable(tableDescr) 
def convert(triple: (Int, String, Int)) = { 
  val put = new Put(Bytes.toBytes(triple._1)) 
  put.addImmutable(Bytes.toBytes("info"), Bytes.toBytes("name"),Bytes.toBytes(triple._2)) 
  put.addImmutable(Bytes.toBytes("info"),Bytes.toBytes("price"),Bytes.toBytes(triple._3)) 
  (new ImmutableBytesWritable, put) 
} 
val initialRDD = sc.parallelize(List((1,"apple",11), (2,"banana",12), (3,"pear",13))) 
val localData = initialRDD.map(convert) 
localData.saveAsHadoopDataset(jobConf)

Yuan_CSDF

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Spark读写MySQL与HBase

1. MySQL读取val sparkConf = new SparkConf().setMaster("local[2]").setAppName("JdbcApp")val sc = new SparkContext(sparkConf)val rdd = new org.apache.spark.rdd.JdbcRDD(sc, () =&gt; { Class.forName...
复制链接

扫一扫