model.save(sc,'fname')异常Exception in thread "dag-scheduler-event-loop" java.lang.StackOverflowError

最新推荐文章于 2023-06-14 22:39:15 发布

TURING.DT

最新推荐文章于 2023-06-14 22:39:15 发布

阅读量988

点赞数

分类专栏： Spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/levy_cui/article/details/103875930

版权

Spark 专栏收录该内容

23 篇文章 0 订阅

订阅专栏

最近在使用pyspark保存model的时候出现Exception in thread "dag-scheduler-event-loop" java.lang.StackOverflowError报错，

网上搜索了一下找下如下解决方案，有效。

解决方法：

操作步骤一

1.连接上提交spark-submit的服务器，输入下面命令，可以看看默认的栈大小，我的是1M

java -XX:+PrintFlagsFinal -version | grep ThreadStackSize

2.找到spark的配置文件，每个人的环境不一样，这里就不贴路径了，编辑之

sudo gedit  /usr/local/spark/conf/spark-defaults.conf

3.在最后面加上如下配置，大小可根据实际情况指定，大点无所谓，小了要报错。

spark.driver.extraJavaOptions=-Xss30M

重启spark是配置生效

注意：如果无法修改spark集群的参数，可以在spark-submit提交任务时增加参数--conf "spark.driver.extraJavaOptions=-Xss30M"

操作步骤二：

主程序if __name__ == "__main__": 加入

sc.setCheckpointDir('checkpoint')

样例如下：

    if __name__ == "__main__":
        sc=CreatSparkContext()
        sc.setCheckpointDir('checkpoint')
        print("=========数据准备阶段===========")
        ratingsRDD = PrepareData(sc)
        print("===========训练阶段============")
        print("开始ALS训练，参数 rank=5,interations=20, lambda=0.1");
        model = ALS.train(ratingsRDD, 5, 20, 0.1)
        print("==========存储 Model==========")
        SaveModel(sc)

参考：https://blog.csdn.net/weixin_38504735/article/details/103281299

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。