黏包现象
什么是黏包
- 当发送网络数据时,tcp协议会根据Nagle算法将时间间隔短,数据量小的多个数据包打包成一个数据包,先发送到自己操作系统的缓存中,然后操作系统将数据包发送到目标程序所对应操作系统的缓存中,最后将目标程序从缓存中取出,而第一个数据包的长度,应用程序并不知道,所以会直接取出数据或者取出部分数据,留部分数据在缓存中,取出的数据可能第一个数据包和第二个数据包粘到一起
- 下面通过代码来说明黏包现象
- 通过结果我们可以看到,客户端其实是发了两条信息,而服务端将这两条信息合并为了一条信息,这就是黏包现象,因为应用程序并不知道第一个数据的长度,是从缓存中直接抽取一部分数据,所以可能会出现这种,两次的信息黏在一起的现象。
解决方案
- 接下来讨论上述黏包现象的解决方案,在这之前先引入一个模块,叫做struct模块,struct模块中最重要的两个函数为pack和unpack
- pack函数:作用是将数据以一定的方式打包成二进制格式。
- unpack函数:作用是从写好的二进制文件中读出文件。
- 引入struct模块以后,我们解决黏包的思路就有了,因为黏包现象是因为不知道第一个数据的长度引起的,故而我们可以在发送真正的数据之前,先发送第一个数据的长度给服务端,而pack函数固定将数据打包成4个长度的二进制文件使得我们可以将第一次接收的长度设为固定的4,从而很好的阻止接收长度时出现黏包现象,有了长度之后不但可以解决黏包现象,还可以解决由于数据过大,超过接收的最大值导致数据一次不能接收完成的问题。
- 具体的代码如下:
- 客户端
import socket
import struct
def main():
client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
client.connect(('127.0.0.1', 7890))
header = client.recv(4)
data_size = struct.unpack('i', header)[0]
recv_size = 0
total_data = b''
while recv_size < data_size:
data_recv = client.recv(1024)
total_data += data_recv
recv_size += len(data_recv)
print(total_data.decode('utf-8'))
if __name__ == '__main__':
main(