Spark 整合 hive

最新推荐文章于 2023-02-18 10:21:27 发布

IT_ZhiCunGaoYuan

最新推荐文章于 2023-02-18 10:21:27 发布

阅读量270

点赞数

文章标签： spark hive big data

本文链接：https://blog.csdn.net/IT_liuzhiyuan/article/details/120322371

版权

CDH 版本： cdh6.3.2

组件版本：

hadoop 版本： 3.0.0

spark 版本：2.4.0

hive 版本：2.1.1

使用编码方式进行整合

首先添加spark-hive 依赖和hive 依赖

        <dependency>
            <groupId>org.apache.hive</groupId>
            <artifactId>hive-exec</artifactId>
            <version>2.1.1-cdh6.3.2</version>
        </dependency>

    

        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-hive_2.11</artifactId>
            <version>2.4.0-cdh6.3.2</version>
      </dependency>

spark session 配置

def sc: SparkSession = {
    var conf = new SparkConf()
      .set("spark.sql.legacy.allowCreatingManagedTableUsingNonemptyLocation", "true")
      .set("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
      .set("spark.sql.warehouse.dir", "your hdfs parth")
      .set("hive.metastore.uris", "your hive metastore path")
    SparkSession.builder()
      .config(conf)
      .enableHiveSupport()
      .getOrCreate()
  }

如果你的cdh 集群中没有将hive-core.xml 和hive-site.xml copy 到spark conf 目录下可以使用该方式进行整合。

使用这种方式整合hive 需要hiveserver2 已经启动通过hive.metastore.uris 获取hive元数据

IT_ZhiCunGaoYuan

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Spark 整合 hive

CDH 版本： cdh6.3.2组件版本：hadoop 版本： 3.0.0spark 版本：2.4.0hive 版本：2.1.1使用编码方式进行整合首先添加spark-hive 依赖和hive 依赖 <dependency> <groupId>org.apache.hive</groupId> <artifactId>hive-exec</arti...
复制链接

扫一扫