背景:最近需要通过nmap扫描服务器的端口,此功能通过websocket 和前端进行交互,当前端出发端口扫描之后,后端通过websocket将扫描到的信息返给前端,完成后,给前端一个关闭的信号。
在本地调试成功后,发布到测试环境进行测试,但是却一直无法成功。日志打印broken pipe。
出现“Broken pipe ”可能的情况:
1、客户端请求服务器数据,服务器突然挂了;
2、客户端请求服务端数据,服务端正常返回,但客户端由于连接超时或者其他原因断开导致服务端无返回通道导致。
根据以往的经验可知应该是客户端将socket断开了,但是和前端同事沟通后得知,前端并未主动关闭socket。于是就懵逼了。
对应的错误日志如下:
于是梳理了一下系统的大概流程,排查到底哪里出现了问题
由于不确定那个环节出现了问题,所以,就用postman模拟websocket 进行测试,直连服务和网关均是成功。但是通过nginx代理后,就出现了问题,试了两次,发现距离上一次服务端发送信息给浏览器间隔60s。nmap的扫描一个服务器的耗时要在80s左右,于是猜测可能是nginx的某个配置低于nmap的扫描耗时,导致出现了上述问题。再次搜索资料可知:
定义从代理服务器读取响应的超时。 仅在两个连续的读取操作之间设置超时,而不是为整个响应的传输设置超时。 如果代理服务器在此时间内未传输任何内容,则连接将关闭。
于是将proxy_read_timeout 设置为180s,再次重试,结果正常。
参考资料如下:
- 解决java.io.IOException: Broken pipe的报错 https://blog.csdn.net/Melo_FengZhi/article/details/123468640
- 排查IOException Broken pipe 错误,偶遇国外小哥:https://cloud.tencent.com/developer/article/2052420
- nginx配置参数:https://nginx.org/en/docs/http/ngx_http_proxy_module.html#proxy_read_timeout