Spark JDBC连接ClickHouse读写操作

Spark JDBC连接ClickHouse读写操作

一、依赖

  	<!--    spark-->
    <!-- https://mvnrepository.com/artifact/org.apache.spark/spark-core -->
    <dependency>
      <groupId>org.apache.spark</groupId>
      <artifactId>spark-core_2.11</artifactId>
      <version>2.3.4</version>
    </dependency>
    <!-- https://mvnrepository.com/artifact/org.apache.spark/spark-sql -->
    <dependency>
      <groupId>org.apache.spark</groupId>
      <artifactId>spark-sql_2.11</artifactId>
      <version>2.3.4</version>
    </dependency>
    
    
    <!--    clickhouse-->
    <!-- https://mvnrepository.com/artifact/ru.yandex.clickhouse/clickhouse-jdbc -->
    <dependency>
      <groupId>ru.yandex.clickhouse</groupId>
      <artifactId>clickhouse-jdbc</artifactId>
      <version>0.2.4</version>
    </dependency>

二、读

现有表创建如下

create table ck_test.myOperator(
id String COMMENT '主键',
name String COMMENT '名称',
is_deleted Int32 COMMENT '是否删除 0:否 1:是',
gmt_created DateTime COMMENT '创建时间',
gmt_modified DateTime COMMENT '修改时间'
)ENGINE = Memory;

insert into ck_test.myOperator values(1,'马云',1,'2019-01-01 00:00:00','2019-01-01 00:00:00') ;
object spark_ClickHouse {
  def main(args: Array[String]): Unit = {
    val spark = SparkSession.builder()
      .appName("spark_ck")
      .master("local[*]")
      .getOrCreate()

    val ck_params_Map = Map[String,String](
      "driver"->"ru.yandex.clickhouse.ClickHouseDriver",
    "url"-> "jdbc:clickhouse://192.168.56.20:8123/ck_test",
      "dbtable"-> "myOperator"
    )
    
    spark.read.format("jdbc").options(ck_params_Map).load().show(false)
    spark.stop()
  }
}

在这里插入图片描述

二、写

object spark_ClickHouse {
  def main(args: Array[String]): Unit = {
    val spark = SparkSession.builder()
      .appName("spark_ck")
      .master("local[*]")
      .getOrCreate()

      //生成df
    val external_info = spark.createDataFrame(Seq(
      (2,"马化腾",0,"2019-01-01 00:00:00","2019-01-01 00:00:00"),
      (3,"周杰伦",0,"2019-01-01 00:00:00","2019-01-01 00:00:00")
    )).toDF("id","name","is_deleted","gmt_created","gmt_modified")

      //写入参数
    val write_maps = Map[String,String](
      "batchsize"->"2000",
      "isolationLevel"->"NONE",
      "numPartitions"->"1"
    )
    val url = "jdbc:clickhouse://192.168.56.20:8123/ck_test"
    val dbtable = "myOperator"
    val pro = new Properties()
    pro.put("driver","ru.yandex.clickhouse.ClickHouseDriver")
    
      //jdbc方式写入
    external_info.write.mode(SaveMode.Append)
        .options(write_maps)
        .jdbc(url,dbtable,pro)
    spark.stop()
  }
}

再次使用jdbc读取的方式展示数据,发现数据已经以Append的方式增加进去
在这里插入图片描述

  • 1
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
Spark SQL可以通过JDBC连接MySQL数据库,实现读写数据的操作。 具体步骤如下: 1. 在Spark应用程序中,引入MySQL JDBC驱动程序。 2. 使用SparkSession对象创建一个DataFrame,指定MySQL数据库的连接信息和查询语句。 3. 使用DataFrame的API进行数据读取或写入操作。 例如,以下代码演示了如何使用Spark SQL通过JDBC连接MySQL数据库读取数据: ``` import org.apache.spark.sql.SparkSession object SparkSQLJDBCExample { def main(args: Array[String]): Unit = { val spark = SparkSession.builder() .appName("Spark SQL JDBC Example") .master("local[*]") .getOrCreate() val jdbcDF = spark.read .format("jdbc") .option("url", "jdbc:mysql://localhost:3306/test") .option("driver", "com.mysql.jdbc.Driver") .option("dbtable", "employee") .option("user", "root") .option("password", "password") .load() jdbcDF.show() spark.stop() } } ``` 在这个例子中,我们使用SparkSession对象创建了一个DataFrame,通过JDBC连接MySQL数据库,读取了employee表中的数据,并使用show()方法展示了数据。 类似地,我们也可以使用DataFrame的API进行数据写入操作,例如: ``` jdbcDF.write .format("jdbc") .option("url", "jdbc:mysql://localhost:3306/test") .option("driver", "com.mysql.jdbc.Driver") .option("dbtable", "employee_copy") .option("user", "root") .option("password", "password") .save() ``` 这段代码将DataFrame中的数据写入到MySQL数据库的employee_copy表中。 总之,Spark SQL通过JDBC连接MySQL数据库,可以方便地实现数据的读写操作
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值