最近在做linux的项目,需要使用EPOLL监听socket,这个项目是刚进入公司刚接触linux开发的第一个项目,所以socket那一块直接复用了之前的某些代码,使用EPOLL监听程序作为socket服务端或客户端的所有FD,代码测试过程中发现了这么一个问题:
当程序作为服务端时,某些情况下,可以接收到客户端的链接申请,完成socket建立后,收到客户端发送的业务消息,处理后发送给客户端,客户端却收不到任何数据,通过日志查看到一个奇怪的现象是,客户端因为超时关闭socket之前,服务端的recv却返回了0,然后调用close关闭了socket。进一步调查发现recv返回0的时候,errno却不是0。
默认情况下,即使服务端主动关闭socket,客户端应该也可以收到,但是一直到超时,客户端都没有收到任何数据,且未检测到服务端已经关闭了socket。
同样在一台机器运行的其他软件却没有发现类似问题,调查发现其他软件使用了libev和boost管理socket,libev和boost使用的EPOOL模式是LT,而我使用的为ET,很多网站和个人都在说慎用ET,我觉得除了对socket缓存的处理需要注意之外,不稳定因素也占了很大原因。
改回LT后未出现类似问题。
经验和知识有限,没有继续探究出现问题的原因,这个现象的复现也很麻烦,因为出现问题时百度了好久没有找到合理的解决方法,所以写到这里。