在这里总结一下这Linux用TCP通讯需要注意的几个问题,都是前一阵子工作中遇到的问题。
问题1. 发送和接收数据时的不完整问题
以接收为例,当对端发送1000个字节的数据时,本端进行接收,会出现调用recv返回500并且errno==EAGAIN的情况(测试中发现这种情况非常严重),这个错误表示当前设备忙,稍后再试。理想化的解决办法是这样的:
使用select或者epoll机制,当有数据到来时,select或epoll会通知,此时一直接收直到recv返回0表示所有数据都接收完。过程中当errno==EAGAIN则暂停接收,并将已经接收的数据缓存起来。当设备再次可读时select或者epoll会再次通知,在缓存数据的后面继续接收,如此反复n次直到recv返回值为0。
但是这种方法需要把已经接收的部分数据进行缓存,实现起来非常繁琐,我进行了如下的简单实现,是我封装的epoll中的部分代码:
int
mo_epoll_recv (int s, void* buf, int buf_size, int err)
{
int recved_len = 0;
int total_recv_len = 0;
int count = 0;
if (buf == NULL || buf_size <= 0)
{
return -1;
}
MO_DEBUG ("to recv some data!\n");
do
{
//MO_DEBUG ("call recv, total_recv_len=%d recv_len=%d\n", total_recv_len, buf_size-total_recv_len);
recved_len = recv (s, buf+total_recv_len, buf_size-total_recv_len, err);
//MO_DEBUG ("called recv, recved_len=%d\n, errno=%d:EAGAIN=%d:%s\n", recved_len, errno, EAGAIN, strerror (errno));
if (recved_len < 0 && errno != EAGAIN)
{
MO_ERROR ("some error when recv erron: %d, %s", errno, strerror (errno));
break;
}
else if (recved_len < 0 && errno == EAGAIN)
{
recved_len = 1;
/* 10s timeout */
if (++count > 200)
{
break;
}
usleep (1000*50);
continue;
}
total_recv_len += recved_len;
if (total_recv_len >= buf_size)
{
recved_len = 0;
//MO_DEBUG ("recv %d bytes!!!!!", total_recv_len);
break;
}
usleep (1000*50);
}while(recved_len > 0);
MO_DEBUG ("recv some data over %d bytes!\n", total_recv_len);
if (recved_len == -1)
return -1;
return total_recv_len;
}
int
mo_epoll_send (int s, const void* buf, int buf_size, int err)
{
int sended_len = 0;
int total_send_len = 0;
if (buf == NULL || buf_size <= 0)
{
return -1;
}
MO_DEBUG ("to send some data!\n");
do
{
sended_len = send (s, (buf+total_send_len), buf_size-total_send_len, err);
if (sended_len == -1 && errno != EAGAIN)
{
break;
}
else if (sended_len == -1 && errno == EAGAIN)
{
sended_len = 1;
continue;
}
total_send_len += sended_len;
if (total_send_len >= buf_size)
{
sended_len = 0;
//MO_DEBUG ("send %d bytes!!!!!", total_send_len);
break;
}
}while(sended_len > 0);
MO_DEBUG ("send some data over %d bytes!\n", total_send_len);
if (sended_len == -1)
return -1;
return total_send_len;
}
问题2. 干净的关闭socket,应该使用如下方法来关闭你不使用的socket,不要仅仅调用close():
void
cleanclose (int s)
{
int i = 0;
char buf[100];
/* 关闭写入 */
shutdown (s, SHUT_WR);
/* 接收所有数据 */
do
{
i = recv (s, buf, 100, 0);
}while (i > 0);
/* 关闭读取 */
shutdown (s, SHUT_RD);
/* 关闭socket */
close (s);
}