spark将数据写入phoenix

最新推荐文章于 2023-03-01 14:43:01 发布

Yuan_CSDF

最新推荐文章于 2023-03-01 14:43:01 发布

阅读量2.3k

点赞数 1

分类专栏： # HBase # Spark基础

本文链接：https://blog.csdn.net/Yuan_CSDF/article/details/97264624

版权

Spark基础同时被 2 个专栏收录

17 篇文章 1 订阅

订阅专栏

HBase

3 篇文章 0 订阅

订阅专栏

  // log4j2 使用了全局异步打印日志的方式，还需要引入disruptor的依赖
  def main(args: Array[String]): Unit = {
    val spark = SparkSession.builder().master("local[*]").appName("phoenix-test").getOrCreate()
    // 第一种读取方法
    //    val df = spark.read.format("org.apache.phoenix.spark")
    //      .option("table", "TEST_YUAN")
    //      .option("zkUrl", "10.31.1.123,10.31.1.124,10.31.1.125:2181")
    //      .load()
    //    // 对列名的大小写不敏感，对值的大小写敏感
    //   val df2 = df.filter("mycolumn  like 'Hell%'")
    //   df2.show()
    //
    val configuration = new Configuration()
    configuration.set("hbase.zookeeper.quorum", "10.31.1.123,10.31.1.124,10.31.1.125:2181")
    // configuration.set("mapreduce.output.fileoutputformat.outputdir", "/tmp")
    // configuration.set("mapred.output.dir", "E:/hbase")
    // 第二种读取方法
    import org.apache.phoenix.spark._
    val df = spark.sqlContext.phoenixTableAsDataFrame("TEST_YUAN", Array("ROW", "FAMM", "NAME"), conf = configuration)
    df.show()
// create table "TEST_YUAN22"("ROW" VARCHAR PRIMARY KEY,"BASE"."FAMM" VARCHAR,"BASE"."NAME" VARCHAR);
    //第一种存储方法
    // java.lang.IllegalArgumentException: Can not create a Path from an empty string   可以将spark2.2.0降为2.1.1解决问题
    // 这个问题其实可以忽略，因为即使报错，也会将数据存入，最好的方法是try
    // 表一定要存在
    //    df.write
    //      .format("org.apache.phoenix.spark")
    //      .mode("overwrite")
    //      .option("table", "TEST_YUAN22")
    //      .option("zkUrl", "10.31.1.123,10.31.1.124,10.31.1.125:2181")
    //      .save()

    //第二种存储方法
    df.saveToPhoenix(Map("table" -> "TEST_YUAN22", "zkUrl" -> "10.31.1.123,10.31.1.124,10.31.1.125:2181"))
  }