413 Request Entity too large,后台没有access日志,服务器标识是nginx或者stcgw
方案1:排查nginx代理配置client_max_body_size太小,默认的大小为1M,增大client_max_body_size的值为200MB
结果1:stag、preview成功
方案2:排查Tomcat配置post-max-size、max-upload-size
结果2:Tomcat在上传的文件的大小大于配置的CommonFileUpload的最大太小时,后台会报错:FileSizeLimitExceededException,但实际情况并没有,失败
方案3:运维协助排查,发现nginx前面还存在一层负载均衡,这一层负载均衡存在request body的大小限制
结果:运维配置了较大的数,成功解决了这个问题,但这只是临时的解决的方案,小文件上传倒没有什么太多的坑,大文件上传需要考虑整个链路的配置,而且需要跟其他业务接口进行分离,不然会导致nginx负载较高,使用三方上传比自己实现一个要简单高效得多
上传了一部分突然失败,后台有请求日志,出现EOF异常
分析:我认为这种情况肯定是某个节点出现了超时
方案1:排查nginx超时配置:
ngx_http_core_module:client_body_timeout
ngx_http_proxy_module:proxy_read_timeout、proxy_send_timeout、send_timeout
结果1:失败,事后仔细研究文档说明发现
client_body_timeout:client -> nginx,表示两次成功读操作之间的最大时间间隔。
proxy_send_timeout:nginx -> proxied server,表示两次成功写操作之间的最大时间间隔
proxy_read_timeout:proxied server -> nginx,表示两次读操作之间的最大时间间隔
send_timeout:nginx -> client,表示两次成功写操作之间的最大时间间隔,并非整个响应。
方案2:排查Tomcat connectionTimeout和KeepAliveTimeout配置
结果2:失败,事后仔细研究源码后发现KeepAliveTimeout的配置是没有影响的——Tomcat的KeepAliveTimeout只跟第一次读操作的超时时间有关
方案3:排查前端ajax超时
结果3:成功
总结:
1、对整个链路不是很熟悉,这部分查找相关资源进行了解
2、对各个节点的配置不是很熟悉
3、没有对问题进行梳理,有点病急乱投医的感觉
参考:
1、Nginx超时机制的相关源码:ngx_process_cycle.c、ngx_event.c、ngx_event_timer.c、ngx_http_request_body.c