TCP底层不了解应用层数据的含义,它会根据TCP缓冲区的实际情况进行包的划分,所以业务上认为,一个完整的包(应用层数据)可能被TCP拆分为多个包进行发送,也可能把多个小包封装成一个大的数据包进行发送,这就是所谓的TCP粘包和拆包问题。出现粘包的原因是多方面的,可能是来自发送方,也可能是来自接收方。
拆包和粘包是在socket编程中经常出现的情况,在socket通讯过程中,如果通讯的一端一次性连续发送多条数据包,tcp协议会将多个完整的消息(应用层数据)打包成一个tcp报文发送出去,这就是所谓的粘包。而如果通讯的一端发送完整消息超过一次tcp报文所能传输的最大值时,就会将一个数据包拆成多个最大tcp长度的tcp报文分开传输,这就叫做拆包。
如图所示,客户端和服务端之间的通道代表TCP的传输通道,两个箭头之间的方块代表一个TCP数据包(去掉TCP首部),正常情况下一个TCP包传输一个应用数据。粘包时,两个或多个应用数据包被粘合在一起通过一个TCP包传输。而拆包情况下,会一个应用数据包会被拆成两段分开传输,其他的一段可能会和其他应用数据包粘合。
注意:粘包和拆包,这里的包实际指的是应用层的完整的数据或消息,而不是TCP数据包。