如何使用Spark连接Hive

最新推荐文章于 2024-08-28 08:37:01 发布

STAR･Wang

最新推荐文章于 2024-08-28 08:37:01 发布

阅读量2.2k

点赞数 1

文章标签： spark

本文链接：https://blog.csdn.net/balalaxstar/article/details/116712145

版权

使用Spark连接Hive获取数据

一、在连接前，先保证服务器端的运行环境正常

1、Linux窗口输入start-all.sh启动hadoop环境
2、再输入 hive --service metastore & 启动hive服务
在这里插入图片描述

3、在Linux窗口输入jps检查服务是否都启动
在这里插入图片描述

RunJar代表hive服务已启动

二、使用以下代码连接hive

import org.apache.spark.sql.SparkSession

object sparkToHive {
  def main(args: Array[String]): Unit = {
    val spark = SparkSession.builder().appName("toHive").master("local[*]")
									    //后面是连接自己hive的地址
      .config("hive.metastore.uris", "thrift://192.168.150.100:9083")
      .enableHiveSupport() //  连接hive的时候就加上这条
      .getOrCreate()
      
    val employeeDF = spark.sql("select * from test1.stu")
	//打印表结构
    employeeDF.printSchema()
    //获取数据
    employeeDF.show()

  }
}

运行结果如下

root
 |-- name: string (nullable = true)
 |-- id: integer (nullable = true)

+------+---+
|  name| id|
+------+---+
|wangwu|  1|
+------+---+

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

STAR･Wang

关注关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

spark 使用hive metastore

u013571243的专栏

10-12

5689

有3,4个月没接触hadoop和spark了,有些生疏,实习时用的是nodejs+python,今天休假,在新电脑跑跑大数据(真不敢相信我以前使用赛扬双核内存4G + 核显跑几个虚拟机来运行hadoop和spark的,跑个任务或者编译android源码有时等得蛋疼...) 虽然这些步骤常用好记,不过时间一长-没有-就又得查看doc,所以好记性不如烂笔头 1.开启hdfs st

IDEA下使用Spark连接Hive报错~2021-10-21

heyianliunian的博客

10-21

775

1.问题：Caused by: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.AccessControlException): Permission denied: user=Admin, access=EXECUTE, inode="/tmp/hive":jinghang:supergroup:drwx------ Caused by: org.apache.hadoop.ipc.RemoteException(org.a

参与评论您还未登录，请先登录后发表或查看评论

SparkSession如何连接Hive Metastore？

penriver的博客

04-25

4147

在spark编程中，因为数据存储在hdfs时，需要连接hive metastore，基于spark sql进行数据分析。 1. 连接hive metastore SparkSession连接Hive Metastore，可以通过指定配置文件hive-site.xml【此将文件放在classpath下】, 但有时在本地调试时，不想指定配置文件或没有配置文件hive-site.xml，做法如下注意： 1. 在实际生产环境中，不需要在sparkSession中配置hive.metastore....

Spark2.x 入门：连接 Hive 读取数据（DataFrame）

最新发布

跟着大数据和AI去旅行

08-28

241

一、在Hive中创建数据库和表下面我们进入Hive，新建一个数据库sparktest，并在这个数据库下面创建一个表student，并录入两条数据。下面操作请在Hive命令提示符下操作： hive> create database if not exists sparktest;//创建数据库sparktest hive> show databases; //显示一下是否创建出了spa

八十九、Spark连接Hive

tiantang2renjian的博客

05-17

721

Spark连接Hive

cdh6.2.1下hive on spark配置使用，hue使用，beeline使用，hive-jdbc使用及日志进度获取

weixin_43455443的博客

03-31

2666

CDH6.2.1 环境 1、开启hive on spark配置：在hive配置中搜索 spark ，更改一下配置： YARN 服务上的 Spark 选择spark 默认执行引擎 hive.execution.engine ：spark 执行程序初始数 spark.dynamicAllocation.initialExecutors ：2 ，启动sparksession时，默认初始启动的executor个数，如果配置了 set spark.executor.instances=3 （启动的e

Spark连接Hive的metastore异常

Mrerlou的博客

05-17

676

不过有时候我们在创建SQLContext实例的时候遇到类似下面的 java.lang.RuntimeException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient at org.apache.had...

spark连接HIveDemo

04-13

在大数据处理领域，Spark...在提供的TestDemo文件中，可能包含的是一个完整的Spark连接Hive的示例代码，你可以通过查看和运行这个代码来进一步学习和实践。记得根据你的实际环境配置调整相关参数，以确保程序正常运行。

idea 方式用spark连接hive，并保存数据（问题及解决）

katherine的博客

06-04

1463

背景：背景为用idea编写spark，读取hdfs上的数据，并把处理好的数据保存到hive中问题：

windows下idea使用spark连接hive

06-28

3. 创建SparkSession：在Java代码中创建SparkSession对象，并设置连接Hive的参数，如下所示： ``` SparkSession spark = SparkSession.builder() .appName("SparkHiveExample") .config("spark.sql.warehouse.dir...

SparkSQL-liunx系统Spark连接Hive

weixin_53898747的博客

04-04

476

spark连接hive

spark SQL配置连接Hive Metastore 3.1.2

从大数据到人工智能的博客

01-09

3532

Hive Metastore作为元数据管理中心，支持多种计算引擎的读取操作，例如Flink、Presto、Spark等。本文讲述通过spark SQL配置连接Hive Metastore，并以3.1.2版本为例。通过Spark连接Hive Metastore，需要准备如下文件： hive-site.xml apache-hive-3.1.2-bin spark-3.0.3-bin-hadoop3.2 在完成下述操作之前，当然首先需要安装并启动hive standalone metastore，并将hi

spark代码连接hive_如何在SparkSQL中以编程方式连接到Hive Metastore？

weixin_39776817的博客

01-12

157

我也面临同样的问题，但已经解决了 . 只需按照Spark 2.0版本中的步骤操作即可Step1: 将Hive conf文件夹中的hive-site.xml文件复制到spark conf .Step 2: 编辑spark-env.sh文件并配置你的mysql驱动程序 . (如果您使用Mysql作为hive Metastore . )或者将MySQL驱动程序添加到Maven / SBT(如果使用那些...

spark代码连接hive,如何在SparkSQL中以编程方式连接到Hive Metastore？

weixin_28715081的博客

12-19

377

I'm using HiveContext with SparkSQL and I'm trying to connect to a remote Hive metastore, the only way to set the hive metastore is through including the hive-site.xml on the classpath (or copying it ...

【hive和spark】hive on spark和spark读取hive metastore配置

lisacumt的专栏

05-20

937

hive on spark和spark读取hive metastore配置

Spark与Hive整合

Whisperya6的博客

02-21

252

实现上述步骤包含两点：1.MetaStore需要存在并开机。2.Spark知道MetaStore的IP和端口号。成功进入后，输入 spark.sql("show databases").show() 查看数据库。执行以下命令将连接驱动包拷贝到spark的jars目录下，若是完全分布式安装，则三台机器都要进行拷贝。打开虚拟机登录节点，执行以下命令来拷贝hive-site.xml到所有的spark安装服务器上面去。Spark连接上Hive的MetaStore。P.s.若安装Hive时启动过该服务则略过。

Spark 配置连接hive 元数据库

akenseren的博客

04-07

5087

Spark 配置连接hive 元数据库第一步安装Hive和Spark(略) 第二步配置 Metastore 到 MySql 原因是， Metastore 默认存储在自带的 derby 数据库中，推荐使用 MySQL 存储 Metastore; 2.1 驱动拷贝上传并解压 mysql-connector-java-5.1.27.tar.gz 驱动包到 hive/lib/ 目录下 [root@hadoop102 mysql-libs]# tar -zxvf mysql-c..

spark-hive连接操作流程、踩坑及解决方法

GitHub-ChauserMondieu

04-05

1646

hive安装；spark-hive兼容版本编译；spark-sql操作hive表格

sparksql与hive整合