spark1.5 hivecontext java_Hive-具有HiveContext的多 spark应用程序

最新推荐文章于 2021-02-28 03:17:53 发布

唱功大学

最新推荐文章于 2021-02-28 03:17:53 发布

阅读量201

点赞数

文章标签： spark1.5 hivecontext java

本文链接：https://blog.csdn.net/weixin_31957989/article/details/114856989

版权

有两个单独的pyspark应用程序来实例化hiveContext而不是sqlcontext，这两个应用程序中的一个会因错误而失败：

例外：(“你必须用 Hive制造 spark。导出“spark_hive=true”并运行build/sbt assembly“，py4jjavaerror(调用none.org.apache.spark.sql.hive.hiveContext时出现错误。

”，javaObject id=o34039))

另一个应用程序成功终止。

我正在使用python API中的spark 1.6，并希望使用一些仅受hiveContext(例如collect_set)支持的 DataFrame 函数。我在1.5.2和更早版本上也遇到过同样的问题。

这足以复制：

import time

from pyspark import SparkContext, SparkConf

from pyspark.sql import SQLContext

conf = SparkConf()

sc = SparkContext(conf=conf)

sq = HiveContext(sc)

data_source = '/tmp/data.parquet'

df = sq.read.parquet(data_source)

time.sleep(60)

睡眠只是让脚本在我启动另一个进程时继续运行。

如果我有两个运行这个脚本的实例，那么在读取 parquet file时会显示上面的错误。当我用sqlcontext替换hiveContext时，一切都很好。

有人知道为什么吗？

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

唱功大学

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Spark(30) -- Spark SQL中更多Parquet文件读写(scala)

erainm

10-07

769

1. 什么时候会用到 Parquet ? 2. 使用代码读写 Parquet 文件 3. 写入 Parquet 的时候可以指定分区 4. 分区发现 5. SparkSession 中有关 Parquet 的配置

java读spark hive_Spark记录-本地Spark读取Hive数据简单例子

weixin_35639451的博客

02-17

790

注意：将mysql的驱动包拷贝到spark/lib下，将hive-site.xml拷贝到项目resources下，远程调试不要使用主机名import org.apache.spark._import org.apache.spark.SparkConfimport org.apache.spark.SparkContextimport org.apache.spark.sql.hive.HiveC...

参与评论您还未登录，请先登录后发表或查看评论

spark1.5 hivecontext java_SparkContext,SQLContext,HiveContext的理解

weixin_35677144的博客

02-28

364

整体来说SparkContext是spark api的入门，可以用来编程SQLContext是sparkSQL的一个分支入口，可以用来操作sqlHiveContext是spark sql中另外分支，用来操作hive第一步spark driver应用程序创建SparkContext，SparkContext 允许spark driver应用程序通过资源管理器访问集群。资源管理器可以是yarn。为了创...

spark1.5 hivecontext java_如何在Spark 1.5.2中使用HiveContext生成PySpark数据帧？

weixin_34791959的博客

02-28

216

更新：看来我的错误可能是因为我如何安装Spark和/或Hive。在Databricks(托管)笔记本中，使用窗口函数似乎非常简单。我得想办法在本地设置这个。在我有一个Spark DataFrame，我需要使用一个Window函数。*我试着按照here上的说明操作，但是遇到了一些问题。在设置我的环境：import osimport sysimport datetime as dtos.environ...

SparkSQL 初步应用（HiveContext使用）

weixin_34194087的博客

04-17

216

折腾了一天，终于解决了上节中result3的错误。至于为什么会产生这个错误，这里，先卖个关子，先看看这个问题是如何发现的：首先，找到了这篇文章：http://apache-spark-user-list.1001560.n3.nabble.com/SparkSQL-select-syntax-td16299.html 里面有这么一段：The issue is that yo...

spark 读取hive java_Spark2.0入门：连接Hive读写数据（DataFrame）

weixin_35397676的博客

02-26

951

【版权声明】博客内容由厦门大学数据库实验室拥有版权，未经允许，请勿转载！[返回Spark教程首页]Hive是基于Hadoop的数据仓库(要想了解更多数据仓库Hive的知识以及如何安装Hive，可以参考厦门大学数据库实验室的Hive授课视频、Hive安装指南)。本节内容介绍Spark如何连接Hive并读写数据。一、让Spark包含Hive支持为了让Spark能够访问Hive，必须为Spark添加Hi...

java读spark hive_项目实战从0到1之Spark（3）spark读取hive数据

weixin_29442031的博客

02-13

670

1.首先将集群的这3个文件hive-site.xml，core-size.xml,hdfs-site.xml放到资源文件里(必须，否则报错)2.代码方面。下面几个测试都可以运行。1)test03.javaimport org.apache.spark.sql.SparkSession;import java.text.ParseException;public classtest03 {publi...

java spark on hive_Spark On Hive 部署和配置

weixin_29056781的博客

02-24

635

Spark On Hive，通过spark sql模块访问和使用Hive，默认Spark预编译(pre-built)版不包含hive相关依赖，并不支持此功能，因此需要对spark源码进行重新编译，并进行相关的配置，下面是具体操作步骤：1.下载最新版spark源码包cd/data/soft/wget-chttp://apache.fayea.com/spark/spark-1.5.2/spar...

sparkshell 操作hive表_Spark记录-Spark-Shell客户端操作读取Hive数据(示例代码)

weixin_39633781的博客

01-14

1092

1.拷贝hive-site.xml到spark/conf下，拷贝mysql-connector-java-xxx-bin.jar到hive/lib下2.开启hive元数据服务：hive --service metastore3.开启hadoop服务：sh $HADOOP_HOME/sbin/start-all.sh4.开启spark服务：sh $SPARK_HOME/sbin/start-al...

hive报错 spark_0510-Spark应用访问Hive报错异常分析

weixin_35348899的博客

01-12

276

温馨提示：如果使用电脑查看图片不清晰，可以使用手机打开文章单击文中的图片放大查看高清原图。Fayson的github：https://github.com/fayson/cdhproject提示：代码块部分可以左右滑动查看噢1故障描述运行环境说明1.RedHat7.22.CM和CDH版本为5.15.03.Spark1.6问题现象在代码中使用HiveContext对象访问Hive表ods_user(...

hivecontext mysql_Spark SQL JAVA和Scala编写Spark SQL程序实现RDD转换成DataFrame+操作HiveContext+操作Mysql...

weixin_39888412的博客

01-27

283

一、以编程方式执行Spark SQL查询1．编写Spark SQL程序实现RDD转换成DataFrame前面我们学习了如何在Spark Shell中使用SQL完成查询，现在我们通过IDEA编写Spark SQL查询程序。Spark官网提供了两种方法来实现从RDD转换得到DataFrame，第一种方法是利用反射机制，推导包含某种类型的RDD，通过反射将其转换为指定类型的DataFrame，适用于...

spark1.5 hivecontext java_scala - 在SparkContext中调用现有的Java / Hive UDF，而不在Spark-SQL应用程序中使用HiveContext ...

weixin_39877504的博客

02-28

174

我在集群上运行Spark 1.5.0。我想从ESRI的API中使用Hive UDF。我可以在Spark应用程序中使用这些API但由于我的集群中存在一些问题，我无法使用HiveContext。我想在Spark-SQL应用程序中使用Existing Hive UDF。// val sqlContext = new SQLContext(sc)// import sqlConte...

spark sql简单示例java

山鹰的专栏

07-22

1万+

运行环境集群环境：CDH5.3.0 具体JAR版本如下： spark版本：1.2.0-cdh5.3.0 hive版本：0.13.1-cdh5.3.0 hadoop版本：2.5.0-cdh5.3.0 spark sql的JAVA版简单示例 spark sql直接查询JSON格式的数据 spark sql的自定义函数

Spark SQL | HiveContext 用法

weixin_37417954的博客

07-03

627

代码如下： object demo2 { def main(args: Array[String]): Unit = { val sparkConf = new SparkConf() //sparkConf.setAppName("HiveContext").setMaster("local[*]") val sc = new SparkContext(sp...

SqlContext和HiveContext

杜海的博客

11-15

1483

SqlContext: 应该是对应spark-sql这个project; 与hive解耦，不支持hql查询;HiveContext:应该是对应spark-hive这个项目; 与hive有部分耦合, 支持hql,是SqlContext的子类,也就是说兼容SqlContext; SQLContext 是什么? SQLContext是通往SparkSQL的入口。下面是如何使用SparkContext...

SparkContext转化为JavaSparkContext

用时间去蜕变

06-20

8656

引言自动Spark2.0发布以来，官方最开始推荐的代码由final SparkConf conf = new SparkConf().setMaster("local").setAppName("---"); final JavaSparkContext ctx = new JavaSparkContext(conf);这种形式转化成为了SparkSession spark = SparkSessi

dataframe操作hive数据仓库【Java纯代码】

wyqwilliam的博客

07-26

701

package com.bjsxt; import org.apache.spark.SparkConf; import org.apache.spark.SparkContext; import org.apache.spark.api.java.JavaSparkContext; import org.apache.spark.sql.DataFrame; import org.apache...

【PySpark】Spark 2.0系列SparkSession与Spark 2.0之前版本中的SQLContext和HiveContext的联系与区别

J小白的博客

05-29

2537

目录 1.Spark在2.0版本和之前版本的入口 2.SQLContext的使用 3.HiveContext的使用 4.SparkSession的三种创建方式 4.1SparkSession直接builder方式 4.2SparkConf的builder方式 4.3SparkContext方式 1.Spark在2.0版本和之前版本的入口在Spark2.0之前，sparkContext是进入Spark的切入点。众所周知的RDD的创建和操作就需要使用sparkCont...

【五】Spark SQL中HiveContext的使用（操作hive中的表）（提交到服务器上执行）（Hadoop HA）