task阻塞在active状态后来恢复了,没有截图,但是和下图类似
排查:
检查了yarn应用日志、spark程序日志一切正常。
得益于这篇文章的帮助,他遇到cpu高的问题,我遇到了内存不足的问题,开始操练:
1、通过spark-ui找到executor启动的机器
2、登录executor所在机器,运行:jps -ml|grep yarnApplicationId,获取到进程id
3、通过top -p 进程id 查询cpu并不高,但是内存 很高,在使用free -h查询,只有几百M, 全部被buff/cache占了
4、执行echo 3 > /proc/sys/vm/drop_caches释放cache之后,处于active的task马上往下执行了