spark出现AttributeError: 'NoneType' object has no attribute '_jvm'

在PySpark中自定义UDF函数时,使用round()方法可能导致AttributeError。原因是from pyspark.sql.functions import *导入的函数覆盖了Python内置函数。解决办法是在UDF中重新导入Python的内置round()函数。

问题:
在pyspark中自定义udf函数,在自定义函数中使用round()方法,代码如下:

def get_rent_sale_ratio(num,total):
	return str(round(num/total,3))

在运行PySpark程序的时候,报错为: AttributeError: ‘NoneType’ object has no attribute ‘_jvm’

解决办法:
使用from pyspark.sql.functions import * 倒入pyspark函数时,覆盖了python的round()方法导致的,因此在自定义函数中重新引入round函数就可以了。代码如下

def get_rent_sale_ratio(num,total):
	builtin = __import__('__builtin__')
	round = builtin.round
	return str(round(num/total,3))

from pyspark.sql.functions import *这句话覆盖了很多python自带的函数,因此,不只round函数,其他函数也可能会有被覆盖的情况出现。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值