如何使用Spark连接Hive

最新推荐文章于 2024-06-20 23:12:30 发布

STAR･Wang

最新推荐文章于 2024-06-20 23:12:30 发布

阅读量2.2k

点赞数 1

文章标签： spark

本文链接：https://blog.csdn.net/BalalaXSTAR/article/details/116712145

版权

使用Spark连接Hive获取数据

一、在连接前，先保证服务器端的运行环境正常

1、Linux窗口输入start-all.sh启动hadoop环境
2、再输入 hive --service metastore & 启动hive服务
在这里插入图片描述

3、在Linux窗口输入jps检查服务是否都启动
在这里插入图片描述

RunJar代表hive服务已启动

二、使用以下代码连接hive

import org.apache.spark.sql.SparkSession

object sparkToHive {
  def main(args: Array[String]): Unit = {
    val spark = SparkSession.builder().appName("toHive").master("local[*]")
									    //后面是连接自己hive的地址
      .config("hive.metastore.uris", "thrift://192.168.150.100:9083")
      .enableHiveSupport() //  连接hive的时候就加上这条
      .getOrCreate()
      
    val employeeDF = spark.sql("select * from test1.stu")
	//打印表结构
    employeeDF.printSchema()
    //获取数据
    employeeDF.show()

  }
}

运行结果如下

root
 |-- name: string (nullable = true)
 |-- id: integer (nullable = true)

+------+---+
|  name| id|
+------+---+
|wangwu|  1|
+------+---+

STAR･Wang

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
如何使用Spark连接Hive

使用Spark连接Hive获取数据一、在连接前，先保证服务器端的运行环境正常1、Linux窗口输入start-all.sh启动hadoop环境2、再输入 hive --service metastore & 启动hive服务3、在Linux窗口输入jps检查服务是否都启动 RunJar代表hive服务已启动二、使用以下代码连接hiveimport org.apache.spark.sql.SparkSessionobject sparkToHive { de
复制链接

扫一扫