问题描述:
近期在对新做的服务器做压力测试时,发现服务端在接收一阵子数据之后便不再响应,不能接收新的连接,也不能接收新的数据。并且服务端接收到的数据个数非常有规律,每次都基本固定。
架构:
服务端基于select模型,测试客户端为socket client
问题查找:
1、最开始在没有跟踪代码的情况下,先是怀疑服务端在收完数据后在处理过程中,由于某种原因产生了死锁,检查代码后排除
2、程序中加入详细日志,观察程序是死在了哪个地方。多次测试后发现,服务端在回复客户端多次后,在send时卡住了
3、思考send卡住的原因:会不会跟socket的缓冲区有关系?或者是有其它配置问题?
调试解决:
1、根据资料显示,socket默认的发送缓冲大小为8192字节,使用setsockopt修改缓冲区后,服务端收到数据的次数有明显变化
int sbuflen = 8192*2;
setsockopt(ListenSocket, SOL_SOCKET, SO_SNDBUF, (const char*)&sbuflen, sizeof(int));
2、经分析,是由于测试客户端没有处理recv,服务端不断send,导致send缓冲区变满,从而卡死了send
3、测试客户端加入对recv的处理后,问题解决
结论:
1、资料显示socket的send缓冲区默认为8192字节(8k),但是在实际测试中发现,send的数据在达到约23k时才会卡死,为什么两个值会有这么大的差异,还需进一步核实
2、不能单纯的把缓冲区改大来解决该问题,要清楚为什么会满
3、在socket编程中,特别是基于TCP的通信,要养成“一问一答”的好习惯,在保证通信数据完整性的同时,也避免了一些出问题的可能