首先说一下为什么需要重试,单个grpc接口在长时间不调用后(大约十几二十分钟)再次调用时会出现
Error: 14 UNAVAILABLE : TCP Read failed 错误。在查阅官方文档之后,可以确定,所有的Error: 14 UNAVAILABLE 都可以直接重试。
但是nodejs官方的grpc包是不包含重试机制的(其他语言的包比如说go就有重试机制)。
这里提供统一增加重试的一种方式:
const grpc_client = new proto.ManageService(machine.ip + ':' + machine.port_b,
grpc.credentials.createInsecure(), {
"grpc.max_receive_message_length": 1024 * 1024 * 100,
"grpc.max_send_message_length": 1024 * 1024 * 100,
}); // 普通的grpc客户端无重试机制
const retry_grpc_client = {} // 有重试机制的grpc客户端(无间隔重试,最多5次)
for(const m in grpc_client){
retry_grpc_client[m] = (args,timeout,callback,count)=>{
if(!count) count = 5
grpc_client[m](args,timeout,(err,res)=>{
if(err && err.toString().startsWith('Error: 14 UNAVAILABLE') && count > 0 ) {
console.log(`debug grpc method retry ---> method: ${ m }, count: ${ 5 - count + 1}`)
return retry_grpc_client[m](args,timeout,callback, --count)
}
return callback(err,res)
})
}
}