前言
TCP粘包是个常见的问题,也有很多文章谈到。我根据自己的经验,争取用一种简洁易懂的办法把粘包的问题和解决办法和读者分享,希望留言指正。
基本概念
TCP本质上是数据流,从原理上看,没有包的概念,TCP包对应用程序员可以是透明的。
粘包实际上是把底层包的实现和上层流的概念混在一起。
粘包问题本质上是如何确定数据流的边界。
确定边界的几种典型办法
1. 固定长度法:一般在简单的私有协议中实现,可以简化流程,方便实现。
-
阻塞发送与接收:
发送:send(fd, wr_data_buf, wr_data_len, 0); /* wr_data_buf 数据缓存, wr_data_len预先设定的固定长度 */ 接收:recv(fd, wr_data_buf, wr_data_len, 0);
如以上代码所示,发送和接收就直接调用socketAPI接口就可以了。这样写简单,但是有如下问题:
- 容易阻塞主进程,引起多余的进程调度和不可控的系统超时;
- 可以用独立的进程或者线程来优化,但会引起复杂的同步逻辑;
- 无法适应大规模的发送端和接收端同时工作的场景。
-
无阻塞的发送和接收:
这种方式编码复杂一点,但是解决了阻塞方式引起的问题,是目前的主流解决方案。-
发送端的流程图是这样的:
-
说明如下:
- 流程图中假设发送的预设固定长度是1024个字节。
- 如果利用EPOLL的Level方式,应该在EPOLLOUT的回调函数中调用alice_send_data,隐式实现3->4->3的循环流程。
- 如果利用EPOLL的Edge方式,应该在EPOLLOUT的回调函数中调用alice_send_epoll,显式实现3-4-3的循环流程。
-
伪代码是这样的:
static int
-
-