Spark On Hive

最新推荐文章于 2023-02-15 10:50:42 发布

Simonhans

最新推荐文章于 2023-02-15 10:50:42 发布

阅读量846

点赞数 1

分类专栏： SPARK 文章标签： spark 大数据 hive

本文链接：https://blog.csdn.net/weixin_43713105/article/details/115027227

版权

SPARK 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Spark On Hive

配置

1.将部署好的hive的路径下的conf/hive-site.xml复制到spark安装路径下的conf/

2.将部署好的hive的路径下的lib/mysql驱动包，我的是（mysql-connector-java-8.0.15.jar）拷贝到spark安装路径下的jars/

3.启动Hive的metastore服务

hive --service metastore

4.启动ZooKeeper集群，启动HDFS集群

5.启动spark-shell

bin/spark-shell --master spark://hadoop2:7077 --executor-cores 1 --executor-memory 1g --total-executor-cores 1

正常打开后：

scala> spark.sql("show tables").show

database	tableName	isTemporary
default	your_table1	false
default	your_table2	false
default	your_table3	false

直接可以使用spark.sql("")获取数据

IDEA 操作集群上的spark on hive

配置

1.将hive安装路径下的conf/hive-site.xml 拷贝至idea scala项目下（为避免报错可在target/classes下也放一份）

在这里插入图片描述

2.在pom.xml中添加依赖

    <!-- SparkSQL  ON  Hive-->
    <dependency>
      <groupId>org.apache.spark</groupId>
      <artifactId>spark-hive_2.11</artifactId>
      <version>2.3.1</version>
    </dependency>
    <!--mysql依赖的jar包-->
    <dependency>
      <groupId>mysql</groupId>
      <artifactId>mysql-connector-java</artifactId>
      <version>5.1.47</version>
    </dependency>

3.在创建session代码中添加hive支持 enableHiveSupport()

4.配置master(spark集群中的master)

测试代码：

package com.bjsxt.scala.spark.sparksql.dataframe

import org.apache.spark.sql.SparkSession

object CreateDFFromHive {
  def main(args: Array[String]): Unit = {
    val spark = SparkSession.builder().enableHiveSupport().appName("spark-hive").master("spark://hadoop2:7077").getOrCreate()
    spark.sql("show tables").show()
  }
}

adoop2:7077").getOrCreate()
spark.sql(“show tables”).show()
}
}

Simonhans

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Spark On Hive

Spark On Hive配置1.将部署好的hive的路径下的conf/hive-site.xml复制到spark安装路径下的conf/2.将部署好的hive的路径下的lib/mysql驱动包，我的是（mysql-connector-java-8.0.15.jar）拷贝到spark安装路径下的jars/3.启动Hive的metastore服务hive --service metastore4.启动ZooKeeper集群，启动HDFS集群5.启动spark-shellbin/spark-sh
复制链接

扫一扫