TCP 粘包问题浅析及其解决方案

最新推荐文章于 2024-06-04 12:50:41 发布

whfstudio

最新推荐文章于 2024-06-04 12:50:41 发布

阅读量3.4k

点赞数 1

分类专栏： Java技术

本文链接：https://blog.csdn.net/github_36379934/article/details/81112259

版权

本文介绍了TCP协议的基本特点，包括面向连接、全双工和面向字节流的特性。接着，详细讨论了TCP粘包和拆包问题，通过三种情况展示了可能出现的现象，并分析了产生这些问题的原因。为了解决粘包、拆包问题，提出了几种常见的解决策略，如使用带消息头的协议、定长消息和设置消息边界。最后，提供了服务器端和客户端的代码实践，展示如何通过定义消息头来处理粘包问题。

摘要由CSDN通过智能技术生成

最近一直在做中间件相关的东西，所以接触到的各种协议比较多，总的来说有TCP，UDP，HTTP等各种网络传输协议，因此楼主想先从协议最基本的TCP粘包问题搞起，把计算机网络这部分基础夯实一下。

贴个广告

楼主的博客已全部搬迁至自己的博客，感兴趣的小伙伴请移步haifeiWu与他朋友们的博客专栏

TCP协议的简单介绍

TCP是面向连接的运输层协议

简单来说，在使用TCP协议之前，必须先建立TCP连接，就是我们常说的三次握手。在数据传输完毕之后，必须是释放已经建立的TCP连接，否则会发生不可预知的问题，造成服务的不可用状态。

每一条TCP连接都是可靠连接，且只有两个端点

TCP连接是从Server端到Client端的点对点的，通过TCP传输数据，无差错，不重复不丢失。

TCP协议的通信是全双工的

TCP协议允许通信双方的应用程序在任何时候都能发送数据。TCP 连接的两端都设有发送缓冲区和接收缓冲区，用来临时存放双向通信的数据。发送数据时，应用程序把数据传送给TCP的缓冲后，就可以做自己的事情，而TCP在合适的时候将数据发送出去。在接收的时候，TCP把收到的数据放入接收缓冲区，上层应用在合适的时候读取数据。

TCP协议是面向字节流的

TCP中的流是指流入进程或者从进程中流出的字节序列。所以向Java，golang等高级语言在进行TCP通信是都需要将相应的实体序列化才能进行传输。还有就是在我们使用Redis做缓存的时候，都需要将放入Redis的数据序列化才可以，原因就是Redis底层就是实现的TCP协议。

TCP并不知道所传输的字节流的含义，TCP并不能保证接收方应用程序和发送方应用程序所发出的数据块具有对应大小的关系（这就是TCP传输过程中产生的粘包问题）。但是应用程序接收方最终受到的字节流与发送方发送的字节流是一定相同的。因此，我们在使用TCP协议的时候应该制定合理的粘包拆包策略。

下图是TCP的协议传输的整个过程：

下面这个图是从老钱的博客里面取到的，非常生动
TCP传输动图

TCP粘包问题复现

理论推敲

如下图所示，出现的粘包问题一共有三种情况

TCP粘包问题

第一种情况：
如上图中的第一根bar所示，服务端一共读到两个数据包，每个数据包都是完成的，并没有发生粘包的问题，这种情况比较好处理，服务器只需要简单的从网络缓冲区去读就好了，每次服务端读取到的消息都是完成的，并不会出现数据不正确的情况。

第二种情况：
服务端仅收到一个数据包，这个数据包包含客户端发出的两条消息的完整信息，这个时候基于第一种情况的逻辑实现的服务端就蒙了，因为服务端并不能很好的处理这个数据包，甚至不能处理，这种情况其实就是TCP的粘包问题。

第三种情况：
服务端收到了两个数据包，第一个数据包只包含了第一条消息的一部分，第一条消息的后半部分和第二条消息都在第二个数据包中，或者是第一个数据包包含了第一条消息的完整信息和第二条消息的一部分信息，第二个数据包包含了第二条消息的剩下部分，这种情况其实是发送了TCP拆包问题，因为发生了一条消息被拆分在两个包里面发送了，同样上面的服务器逻辑对于这种情况是不好处理的。

为什么会发生TCP粘包、拆包