问题来源
最近搞了一个线上服务,涉及到网络请求、图片处理、文件读写等流程,为了解决函数嵌套,我用了async的waterfall方法。结果上线后发现非常不稳定,估计有至少1/4的访问都没有成功。至此,方才明白稳定可靠服务的重要性。
仔细排查了一下日志,发现有下面几个问题
- 程序中的error一定要处理
- 每个过程要考虑失败的情形
第一条程序中的error特别重要,多数情况下是因为忽略了对异常的处理,导致服务不可用。
第二条是对程序可靠性的保证,一个简单粗暴的方法是,只要流程出错,就重试。
Solution
我们知道,使用waterfall可以保证一序列函数执行的顺序,如果函数执行失败了,会直接中断处理流程。比较可靠的办法是,重试流程。
这就用到了async中的retry方法。
var async = require('async');
async.waterfall[
function(callback) {
async.retry({times:5, int