前段时间由于业务需要,需要调取第三方接口拉取数据,滚动拉取(scorll),第一次请求接口不需要带scorll_id,请求接口后会返回scorll_id,第二次请求接口的时候需要带上scorll_id,于是我写的下面这段代码
private static void req(String scroll_id) {
FileWriter writer = new FileWriter("/usr/local/f.json");
writer.write(scroll_id);
i++;
HashMap<String, Object> paramMap = new HashMap<>();
paramMap.put("_scroll_id", scroll_id);
String result= HttpUtil.get("http://xxx.com/xxx", paramMap);
JSONObject jsonObject = JSONUtil.parseObj(result);
byte[] gzip = ZipUtil.gzip(result, "utf-8");
saveDb(gzip,scroll_id);
req(jsonObject.getStr("_scroll_id"));
}
在本地跑了一段时间没问题,后来放到阿里云服务器上,跑了一晚上,第二天查看日志
Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
提示的是req(jsonObject.getStr("_scroll_id"));这段代码报错
我的理解
我们可以看到,栈中每个方法 req都指向堆中真正的对象。由于递归执行时,前面的方法都压到栈中,req一直还指向堆中对象,然后 GC 时,由于对象还处于被引用,虚拟机判定该对象存活,所以不清理这些对象。随着递归方法越来越深入,堆积的 req越来越多,量表引起质变,导致堆内存被占满,引发虚拟机持续 GC。但是每次 GC 之后却无法腾出空间。最后我们看到的现象就是程序执行很慢很慢。