【Pyspark】提取Hive数据报错 java.lang.AssertionError: assertion failed: No plan for HiveTableRelation

最新推荐文章于 2022-06-02 10:33:28 发布

leeshutao

最新推荐文章于 2022-06-02 10:33:28 发布

阅读量1k

点赞数

分类专栏： Spark 文章标签： hive java spark

本文链接：https://blog.csdn.net/yuxeaotao/article/details/125093048

版权

Spark 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

代码：

from pyspark.sql import SQLContext,HiveContext,SparkSession,Row
from pyspark.sql.types import Row,StringType,StructField,StringType,IntegerType
from pyspark.sql.dataframe import DataFrame

spark = SparkSession \
.builder \
.appName("Python Spark SQL basic example") \
.config("spark.some.config.option”,”some-value") \
.getOrCreate()


hive_context= HiveContext(spark)
 
# 生成查询的SQL语句，这个跟hive的查询语句一样，所以也可以加where等条件语句
one_day_ago = "20220429"
hive_read = "select * from temp_exp20220620_gmm_{}".format(one_day_ago)
 
# 通过SQL语句在hive中查询的数据直接是dataframe的形式
read_df = hive_context.sql(hive_read)


read_df.printSchema() # 这句没有问题，有正常输出

read_df.select("f476").show() #这句报错

一般来说这种错误的产生是因为在创建SparkSession对象的时候HiveContext没有被启用。

解决方法

创建SparkSession对象记得启用HiveContext, 即使用enableHiveSupport(), 如下：

from pyspark.sql import SQLContext,HiveContext,SparkSession,Row
from pyspark.sql.types import Row,StringType,StructField,StringType,IntegerType
from pyspark.sql.dataframe import DataFrame

spark = SparkSession \
.builder \
.appName("Python Spark SQL basic example") \
.config("spark.some.config.option”,”some-value") \
.enableHiveSupport() \
.getOrCreate()

解决方案来自：java.lang.AssertionError: assertion failed: No plan for HiveTableRelation的解决方法_Lestat.Z.的博客-CSDN博客

leeshutao

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
【Pyspark】提取Hive数据报错 java.lang.AssertionError: assertion failed: No plan for HiveTableRelation

一般来说这种错误的产生是因为在创建SparkSession对象的时候HiveContext没有被启用。创建SparkSession对象记得启用HiveContext。
复制链接

扫一扫

专栏目录