目录
一、TCP分包概述
分包
场景:发送方发送字符串”helloworld”,接收方却分别接收到了两个数据包:字符串”hello”和”world”
发送端发送了数量较多的数据,接收端读取数据时候数据分批到达,造成一次发送多次读取;
二、造成分包的原因
造成分包的原因:
TCP是以段(Segment)为单位发送数据的,建立TCP链接后,有一个最大消息长度(MSS).如果应用层数据包超过MSS,就会把应用层数据包拆分,分成两个段来发送.
这个时候接收端的应用层就要拼接这两个TCP包,才能正确处理数据。
相关的,路由器有一个MTU( 最大传输单元)一般是1500字节,除去IP头部20字节,留给TCP的就只有MTU-20字节。所以一般TCP的MSS为MTU-20=1460字节
当应用层数据超过1460字节时,TCP会分多个数据包来发送。
三、TCP粘包
场景:发送方发送字符串”helloworld”,接收方却接收到了两个字符串”hello”和”world”
发送端发送了几次数据,接收端一次性读取了所有数据,造成多次发送一次读取;通常是网络流量优化,把多个小的数据段集满达到一定的数据量,从而减少网络链路中的传输次数
四、造成TCP粘包的原因
TCP为了提高网络的利用率,会使用一个叫做Nagle的算法.该算法是指,发送端即使有要发送的数据,如果很少的话,会延迟发送.如果应用层给TCP传送数据很快的话,就会把两个应用层数据包“粘”在一起,TCP最后只发一个TCP数据包给接收端.
五、分包和粘包解决方案
发送数据前,给数据附加两字节的长度:
包标识: 包头部的特殊标识,用来标识包的开始
数据长度:数据包的大小,固定长度,2、4 或者8字节。
数据内容:数据内容,长度为数据头定义的长度大小。
实际操作如下:
a)发送端:先发送包表示和长度,再发送数据内容。
b)接收端:先解析本次数据包的大小N,再读取N个字节,这N个字节就是一个完整的数据内容。
具体流程如下: