spark 读取hive事务表

最新推荐文章于 2022-08-02 23:53:04 发布

Java小田

最新推荐文章于 2022-08-02 23:53:04 发布

阅读量1.6k

点赞数

分类专栏：备忘文章标签： spark hive big data

本文链接：https://blog.csdn.net/li281037846/article/details/122216122

版权

备忘专栏收录该内容

33 篇文章 1 订阅

订阅专栏

参考链接：
spark通过JDBC读取hive事务表
 https://github.com/Gowthamsb12/BigData-Blogs/blob/master/Spark_ACID

import org.apache.spark.sql.jdbc.JdbcDialect
 
object HiveDialect extends JdbcDialect {
  override def canHandle(url : String): Boolean = url.startsWith("jdbc:hive2")
  override def quoteIdentifier(colName: String): String = {
    colName.split('.').map(part => s"`$part`").mkString(".")
  }
}

// Register the scala object 
import org.apache.spark.sql.jdbc.JdbcDialects
JdbcDialects.registerDialect(HiveDialect)

//测试
val jdbcDF = spark.read.format("jdbc").option("url", "jdbc:hive2://hdfs-test03.yingzi.com,hdfs-test04.yingzi.com,hdfs-test05.yingzi.com/;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=hiveserver2").option("dbtable", "default.a11").option("user", "hive").option("password", "hive").option("fetchsize","20").load()

jdbcDF.count()

Java小田

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark 读取hive事务表

spark通过JDBC读取hive事务表https://github.com/Gowthamsb12/BigData-Blogs/blob/master/Spark_ACIDimport org.apache.spark.sql.jdbc.JdbcDialect object HiveDialect extends JdbcDialect { override def canHandle(url : String): Boolean = url.startsWith("jdbc:hive2")
复制链接

扫一扫