sparkSQL 整合hive

最新推荐文章于 2024-05-07 19:24:58 发布

红尘丶世界

最新推荐文章于 2024-05-07 19:24:58 发布

阅读量249

点赞数 1

分类专栏： # spark 文章标签： spark hive

本文链接：https://blog.csdn.net/hongchenshijie/article/details/105526722

版权

spark 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

文章目录

1. Hive开启MetaStore服务

在 $HIVE_HOME/conf/hive-site.xml中添加如下配置

    <property>
      <name>hive.metastore.warehouse.dir</name>
      <value>/user/hive/warehouse</value>
    </property>
    <property>
      <name>hive.metastore.local</name>
      <value>false</value>
    </property>
    <!-- 这个节点名改为自己的,指定端口号,也可以不指定 -->
    <property>
      <name>hive.metastore.uris</name>
      <value>thrift://node01:9083</value>
    </property>

2. 启动 metaStore 和 hiveserver2

nohup $HIVE_HOME/bin/hive --service metastore &

3. SparkSQL整合Hive MetaStore

拷贝 Hadoop 和 Hive 的配置文件到 Spark 的配置目录

hive-site.xml 元数据仓库的位置等信息
core-site.xml 安全相关的配置
hdfs-site.xml HDFS 相关的配置

cp $HIVE_HOME/conf/site.xml   $SPARK_HOME/conf/
cp $HADOOP_HOME/etc/hadoop/core-site.xml  $SPARK_HOME/conf/
cp $HADOOP_HOME/etc/hadoop/hdfs-site.xml  $SPARK_HOME/conf/

4. 把连接mysql 依赖的jar拷贝到 $SPARK_HOME/jars/ (因为hive的元数据保存在mysql)

cp $HIVE_HOME/lib/mysql-connector-java-5.1.38.jar  $SPARK_HOME/jars/

然后在spark/shell中测试(`测试前得先启动集群`)

$SPARK_HOME/bin/spark-shell

测试代码如下

//首先你的hive中不止有一张表
spark.sql("show databases").show
//如果看到多张表说明 spark 整合hive 成功了

在这里插入图片描述

红尘丶世界

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
sparkSQL 整合hive

文章目录一、环境的配置1. Hive开启MetaStore服务在 $HIVE_HOME/conf/hive-site.xml中添加如下配置2. 启动 metaStore 和 hiveserver23. SparkSQL整合Hive MetaStore拷贝 Hadoop 和 Hive 的配置文件到 Spark 的配置目录4. 把连接mysql 依赖的jar拷贝到 $SPARK_HOME/jars/ ...
复制链接

扫一扫