使用torchserve时出错:RESOURCE_EXHAUSTED: gRPC message exceeds maximum size 6553500: 10838210

问题

参考官方说明启动torchserve模型,然后在python client中使用GRPC APIs测试模型,提示如下错误:

io.grpc.StatusRuntimeException: RESOURCE_EXHAUSTED: gRPC message exceeds maximum size 6553500: 10838210

gRPC消息超出了最大限制。

解决方法

在启动torchserve时,指定参数https://github.com/pytorch/serve/blob/master/docs/configuration.md#command-line-parameters

加上--ts-config参数,在传入的配置文件中,修改gRPC允许的最大size。

inference_address=http://0.0.0.0:8080
management_address=http://0.0.0.0:8081
metrics_address=http://0.0.0.0:8082
number_of_netty_threads=32
job_queue_size=1000
model_store=/home/model-server/model-store
workflow_store=/home/model-server/wf-store
max_request_size=65535000

就是其中的max_request_size=65535000,可以从错误提示中看到,默认大小是6553500,我这里直接设置成原来的10倍了,可以根据自己需要进行设置。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
您好,C知道在这里!关于您提到的io.grpc.StatusRuntimeException: RESOURCE_EXHAUSTED异常,这是一个gRPC通信框架抛出的异常。它通常表示请求被拒绝,因为服务器资源已经达到极限。 该异常可能发生在以下情况下: 1. 并发连接数过高:如果服务器同处理的连接数超过其承载能力,就会出现RESOURCE_EXHAUSTED异常。您可以尝试减少并发连接数,或者增加服务器的处理能力。 2. 资源限制:服务器可能设置了某些资源的限制,例如CPU使用率、内存或磁盘空间。当服务器上的某个资源达到限制,就会抛出RESOURCE_EXHAUSTED异常。您可以检查服务器的资源限制,并根据需要进行调整。 3. 请求频率过高:如果您的应用程序发送请求的频率过高,服务器可能无法及处理所有请求,导致资源耗尽。您可以尝试减少请求的频率,或者实现请求的排队机制,以便服务器能够有序地处理请求。 4. 代码错误:有RESOURCE_EXHAUSTED异常可能是由于代码错误引起的,例如无限循环或内存泄漏等。您可以仔细检查代码并修复潜在的问题。 总结来说,io.grpc.StatusRuntimeException: RESOURCE_EXHAUSTED异常表示服务器资源不足。您需要检查服务器的并发连接数、资源限制、请求频率以及代码中的可能错误,以解决这个问题。如果问题仍然存在,您可能需要进一步调查服务器配置和性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值