spark-shell与spark-sql的访问hive

最新推荐文章于 2023-02-13 20:23:04 发布

翰文不是瀚

最新推荐文章于 2023-02-13 20:23:04 发布

阅读量2.5k

点赞数 1

分类专栏： spark hive 文章标签： spark-shell spark-sql

本文链接：https://blog.csdn.net/H_hanwen/article/details/84350916

版权

本文介绍了如何使用Spark-Shell和Spark-SQL访问Hive数据。在Spark-Shell中，通过将hive-site.xml复制到spark/conf并设置参数，可以避免版本不匹配错误，然后使用sql命令获取数据。Spark-SQL提供了更直接的SQL操作方式，可在4040端口的Web页面查看执行结果。相比于Hive，SparkSQL运行速度更快。

摘要由CSDN通过智能技术生成

1.spark-shell的使用：

安装完spark之后，将spark/bin的路径配置到本地文件，即可不需要进入spark/bin目录下启动任务

1）直接打开，运行以下命令会发现无法访问hive表的数据：

spark-shell --master local[2]

spark.sql("show tables").show()

2）将hive/conf目录下的hive-site.xml文件拷贝到spark/conf目录下（且添加参数“hive.metastore.schema.verification”的值为“true”，这样做的目的是使得进入spark客户端时不报版本不匹配错误；但是不添加也是可以正常运行的）

随后运行命令：

spark-shell --master local[2] --jars jar/mysql-connector-java-5.1.27-bin.jar

此处jars后面的参数是mysql的jar包所在的路径

再后即可调用sql命令，并得到结果：

spark.sql("select * from stu").sh

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

翰文不是瀚

关注关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

spark连接hive（spark-shell和eclipse两种方式）

主要分享大数据相关的知识，如Spark、Hudi

05-09

1万+

转载请务必注明原创地址为：http://dongkelun.com/2018/03/25/sparkHive/ 1、在服务器（虚拟机）spark-shell连接hive 1.1 将hive-site.xml拷贝到spark/conf里 cp /opt/apache-hive-2.3.2-bin/conf/hive-site.xml /opt/spark-2.2.1-bin-hadoo...............

spark on yarn模式使用spark-shell spark-sql

yy的博客

09-01

401

spark-shell spark-sql

参与评论您还未登录，请先登录后发表或查看评论

【spark-sql】使用spark-sql或spark-shell访问hive

06-05

785

一、使用spark-shell ，spark访问hive 1.将/opt/hive/conf/hive-site.xml复制到/opt/spark/conf目录下 2.–jars 传递mysql驱动包 3.运行spark-shell ./spark-shell --master local[2] --jars /opt/mysql-connector-java-5.1.22-bin.jar spark.sql("show tables").show 2、使用spark-sql,spark访问hive

Spark记录-Spark-Shell客户端操作读取Hive数据

weixin_30569033的博客

12-05

1233

1.拷贝hive-site.xml到spark/conf下，拷贝mysql-connector-java-xxx-bin.jar到hive/lib下 2.开启hive元数据服务：hive --service metastore 3.开启hadoop服务：sh $HADOOP_HOME/sbin/start-all.sh 4.开启spark服务：sh $SPARK_HOME/sbin/st...

hive 建表_Hive学习笔记

weixin_39684235的博客

11-30

480

01 什么是Hive在关系数据库中，我们创建一张表，我们会指定表名称、列名称、列的类型、这些是表的Schema，而HDFS，文件仅仅是一个文件，他没有Schema，我们没有办法通过SQL的方式对HDFS上的数据进行查询。这时我们要对HDFS上的大数据进行处理的话，我们需要通过MapReduce进行处理。通过前面MapReduce的文章我们可以知道，MapReduce是Hadoop生态中的...

spark-shell引用不了hive数据表的问题 sqlContext hiveContext

wdd668的专栏

03-03

1738

从上面两篇开始一直进入一个错误中关于 jack包引用的问题cdh下载文件安装的环境 centos 7.0hadoop-2.6.0-cdh5.7.0hive-1.1.0-cdh5.7.0scala-2.11.0spark-1.6.0-cdh5.7.0从hadoop伪分布试安装 mysql hive scala的安装都没问题直到spark安装启动spark-shell --master yar...

sparkshell 操作hive表_Spark-shell和Spark-hive的使用

weixin_36198509的博客

02-22

1242

使用命令开启一个spark-shell：./spark-shell --master local[2] --jars /home/iie4bu/software/mysql-connector-java-5.1.35.jar因为我们要操作hive，因此需要添加mysql的driver类。查看表使用命令spark.sql("show tables").show 查看表数据比较spark-shell...

sparkshell 操作hive表_Spark记录-Spark-Shell客户端操作读取Hive数据(示例代码)

weixin_39633781的博客

01-14

1092

1.拷贝hive-site.xml到spark/conf下，拷贝mysql-connector-java-xxx-bin.jar到hive/lib下2.开启hive元数据服务：hive --service metastore3.开启hadoop服务：sh $HADOOP_HOME/sbin/start-all.sh4.开启spark服务：sh $SPARK_HOME/sbin/start-al...

spark-3.2.0-bin-hadoop3-without-hive

04-24

总结来说，“spark-3.2.0-bin-hadoop3-without-hive”是一个专注于 Spark 与 Hadoop 3 基础集成的版本，它提供了最新的 Spark 特性，如优化的 SQL 引擎和 DataFrame API，同时也兼容 Hadoop 3 的诸多改进。...

spark如何读取hive里面的数据（双网卡访问失败解决方法）

虎啸千峰的博客

07-17

648

首先，将hive-site.xml copy到spark/conf目录下 spark shell和spark sql：指定mysql驱动包位置，--jars只会在executor端读取到，driver-class-path可以在driver端读取到 spark-shell/spark-sql --master local[2] --jars ~/lib/mysql-connector-java-5.1.47-bin.jar --driver-class-path ~/lib/mysql-connector

spark-shell & spark-sql 使用

weixin_37417954的博客

07-03

1万+

spark-shell 启动 spark-shell [hadoop@hadoop2 bin]$ ./spark-shell --master local[2] \ --jars /opt/module/hive-1.2.2/lib/mysql-connector-java-5.1.27-bin.jar 通过 spark-shell 操作 hive ...

【七】Spark SQL命令和Spark shell命令操作hive中的表

热门推荐

Sid小杰的博客

07-26

2万+

1.把hive的配置文件hive-site.xml复制到spark/conf下。 2.启动的时候带上MySQL的连接驱动 Spark-shell命令使用 spark-shell是通过得到sparksession然后调用sql方法执行hive的sql。 cd /app/spark/spark-2.2.0-bin-2.9.0/bin ./spark-shell --master local[...

spark程序连接hive后导致hive的shell连接不上

mrye的博客

09-10

489

出现原因：本地写spark代码操作hive，配置文件中直接连接的mysql元数据服务，连接后导致hive的shell端连接不上。排查后发现hive的元数据中VERSION表被spark连接改动了，重新修改后才能在shell端连接 hiveserver2 -hiveconfig hive.root.logger=DEBUG,console 解决： hive-stite文件加上这个配置，通过metastore去连接元数据服务，是因为spark内置的hive版本和元数据服务的hive版本不一致导

【原创】大叔经验分享（65）spark读取不到hive表

weixin_30652897的博客

06-01

816

spark 2.4.3 spark读取hive表，步骤： 1）hive-site.xml hive-site.xml放到$SPARK_HOME/conf下 2）enableHiveSupport SparkSession.builder.enableHiveSupport().getOrCreate() 3) 测试代码 val sparkConf = new Sp...

安装Spark3之后Spark-SQL读不到之前安装好的Hive 数据库

qq_39841823的博客

01-14

1123

安装Spark3之后Spark-SQL读不到之前安装好的Hive 数据库前言一、问题？二、解决方案方法1.引入hive-site.xml方法2.很多步骤 ><1.增加CDH环境配置2.增加spark配置2.1 spark-defaults.conf2.2 spark-env.sh2.3 log4j.properties2.4 分发 spark软件包2.5 执行spark-sql 前言因为之前已经安装过CDH 其中版本为 hive 2.1.1与spark 2.2.0 , 再另外安装Spa..

在Spark-Shell下启用SQL报错：error: not found: value sqlContext解决方案

BigData_Mining的博客

04-27

5203

在Spark-Shell下启用SQL报错：error: not found: value sqlContex解决方案：在Spark2.X.X后，想要在Spark-shell中运行这个命令，你需要使用spark.sqlContext.sql()的形式。

Hudi-集成Spark之spark-shell 方式

迷雾总会解

02-13

496

我们希望类似hive的 "insert overwrite "操作，以忽略现有数据，只用提供的新数据创建一个提交。注意：该表有三级分区（区域/国家/城市），在0.9.0版本以前的hudi，在load中的路径需要按照分区目录拼接"*"，如：load(basePath + “/查询特定时间点的数据，可以将endTime指向特定时间，beginTime指向000（表示最早提交时间）新增数据，生成一些数据，将其加载到DataFrame中，然后将DataFrame写入Hudi表。目前支持三种查询时间格式，如下所示。

spark任务shell运行_基于sparksql调用shell脚本运行SQL

weixin_32137855的博客

01-30

1536

[Author]: kwu基于sparksql调用shell脚本运行SQL，sparksql提供了类似hive中的 -e , -f ,-i的选项1、定时调用脚本#!/bin/sh# upload logs to hdfsyesterday=`date --date=‘1 days ago‘ +%Y%m%d`/opt/modules/spark/bin/spark-sql -i /opt/bin/...

spark-sql整合hive，在spark-sql命令和spark-shell命令下执行sql命令和整合调用hive