Spark: py4j.protocol.Py4JJavaError: An error occurred while calling o91.showString.

最新推荐文章于 2024-11-10 19:24:41 发布

条件漫步

最新推荐文章于 2024-11-10 19:24:41 发布

阅读量2.6k

点赞数

CC 4.0 BY-SA版权

分类专栏： Spark 文章标签： spark big data

本文链接：https://blog.csdn.net/chenhepg/article/details/125304649

Spark 专栏收录该内容

2 篇文章

订阅专栏

博客讲述了在使用Spark的yarn模式执行Python脚本时遇到的Py4JJavaError问题。具体表现为尝试显示一个空DataFrame时出错。作者通过向test.test_table中添加数据解决了该问题，并指出不应将Python DataFrame的操作直接应用到Spark DataFrame上。

@创建于：2022.06.15
@修改于：2022.06.15

利用Spark的yarn模式（把.py文件上传到hadoop平台），执行过程中发现了下面的问题。py4j.protocol.Py4JJavaError: An error occurred while calling o91.showString.

代码段如下：

df = spark.sql("select * from test.test_table")
print(type(df))
df.printSchema()
df.show(3)

log日志如下：

Traceback (most recent call last):
  File "/tmp/spark-0d83b9e6-2801-4a72-9713-5e3fba6f4cbe/main.py", line 44, in <module>
    df.show(3)
  File "/opt/cloudera/parcels/CDH-6.2.1-1.cdh6.2.1.p0.1425774/lib/spark/python/lib/pyspark.zip/pyspark/sql/dataframe.py", line 378, in show
  File "/opt/cloudera/parcels/CDH-6.2.1-1.cdh6.2.1.p0.1425774/lib/spark/python/lib/py4j-0.10.7-src.zip/py4j/java_gateway.py", line 1257, in __call__
  File "/opt/cloudera/parcels/CDH-6.2.1-1.cdh6.2.1.p0.1425774/lib/spark/python/lib/pyspark.zip/pyspark/sql/utils.py", line 63, in deco
  File "/opt/cloudera/parcels/CDH-6.2.1-1.cdh6.2.1.p0.1425774/lib/spark/python/lib/py4j-0.10.7-src.zip/py4j/protocol.py", line 328, in get_return_value
py4j.protocol.Py4JJavaError: An error occurred while calling o91.showString.