pysaprk报错:Py4JJavaError

在尝试使用pyspark的toPandas()函数时遇到了Py4JJavaError,错误根源在于Java版本过高。解决方案是将Java版本切换到1.8,同时环境中的Python为3.7,pyspark版本为2.3.1。
摘要由CSDN通过智能技术生成

Py4JJavaError Traceback (most recent call last)

Py4JJavaError Traceback (most recent call last)
<ipython-input-72-9aec0a3b6033> in <module>
----> 1 pandas_data=data.toPandas()

~/spark-2.3.1-bin-hadoop2.6/python/pyspark/sql/dataframe.py in toPandas(self)
   1966                 raise RuntimeError("%s\n%s" % (_exception_message(e), msg))
   1967         else:
-> 1968             pdf = pd.DataFrame.from_records(self.collect(), columns=self.columns)
   1969 
   1970             dtype = {}

~/spark-2.3.1-bin-hadoop2.6/python/pyspark/sql/dataframe.py in collect(self)
    464         """
    465         with SCCallSiteSync(self._sc) as css:
--> 466             sock_info = self._jdf.collectToPython()
    467         return list(_load_from_socket(sock_info, BatchedSerializer(PickleSerializer())))
    468 

~/spark-2.3.1-bin-hadoop2.6/python/lib/py4j-0.10.7-src.zip/py4j/java_gateway.py in __call__(self, *args)
   1255         answer = self.gateway_client.send_command(command)
   1256         return_value = get_return_value(
-> 1257             answer, self.gateway_client, self.target_id, self.name)
   1258 
   1259         for temp_arg in temp_args:

~/spark-2.3.1
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值