使用pyspark做tf模型预测踩坑记录

最新推荐文章于 2023-03-10 20:10:39 发布

VIP文章 phase11

最新推荐文章于 2023-03-10 20:10:39 发布

阅读量3.1k

点赞数

分类专栏： spark python linux 文章标签： spark tensorflow

本文链接：https://blog.csdn.net/u012908433/article/details/118529794

版权

背景

离线推荐场景在业务中并不罕见，如果对实效性有一定要求，其计算压力会成倍增加，单机环境很难承载计算压力和后续扩展需求，很直接的想法就是借助分布式集群加速计算。这里我们使用pyspark做tf savedmodel的inference，之前没搞过，所以在环境问题上踩了很多坑，这里记录一下。

踩坑记录

报错信息如下

: org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 3.0 failed 1 times, most recent failure: Lost task 0.0 in stage 3.0 (TID 5, localhost, executor driver): java.lang.IllegalArgumentException
	at java.nio.ByteBuffer.allocate(ByteBuffer.java:334)
	at org.apache.arrow.vector.ipc.message.MessageSerializer.readMessage(MessageSerializer.java:543)
	at org.apache.arrow.vector.ipc.message.MessageChannelReader.readNext(MessageChannelReader.java:58)
	at org.apache.arrow.vector.ipc.ArrowStreamReader.readSchema(ArrowStreamReader.java:132)
	at org.apache.arrow.vector.ipc.ArrowReader.initialize(ArrowReader.java:181)
	at org.apache.arrow.vector.ipc.ArrowReader.ensureInitialized

最低0.47元/天解锁文章

phase11

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
使用pyspark做tf模型预测踩坑记录

背景离线推荐场景在业务中并不罕见，如果对实效性有一定要求，其计算压力会成倍增加，单机环境很难承载计算压力和后续扩展需求，很直接的想法就是借助分布式集群加速计算。这里我们使用pyspark做tf savedmodel的inference，之前没搞过，所以在环境问题上踩了很多坑，这里记录一下。踩坑记录报错信息如下: org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 3.0 failed
复制链接

扫一扫