python爬虫结果是字节_python 之网络编程（基于TCP协议Socket通信的粘包问题及解决）...

最新推荐文章于 2023-11-28 11:23:57 发布

weixin_40009207

最新推荐文章于 2023-11-28 11:23:57 发布

阅读量155

点赞数

文章标签： python爬虫结果是字节

本文链接：https://blog.csdn.net/weixin_40009207/article/details/111681346

版权

粘包问题

粘包问题发生的原因：

1.发送端需要等缓冲区满才发送出去，造成粘包(发送数据时间间隔很短,数据了很小,会合到一起,产生粘包),这样接收端，就难于分辨出来了，必须提供科学的拆包机制。 即面向流的通信是无消息保护边界的。

2.接收方不及时接收缓冲区的包，造成多个包接收(客户端发送了一段数据，服务端只收了一小部分，服务端下次再收的时候还是从缓冲区拿上次遗留的数据，产生粘包)

粘包问题主要还是因为接收方不知道消息之间的界限，不知道一次性提取多少字节的数据所造成的。

stract模块

1、把整型数字转成bytes类型 2、转成的bytes是固定长度的

2 利用stract模块解决粘包

为字节流加上自定义固定长度报头，报头中包含字节流长度，然后一次send到对端，对端在接收时，先从缓存中取出定长的报头(报头中含有真实数据长度)，然后再取真实数据

服务端：

客户端：

3.自定义报头

我们可以把报头做成字典，字典里包含将要发送的真实数据的详细信息，字典然后json序列化，编码成byte类型，然后用struck将数据长度打包成4个字节(4个自己足够用了)

发送时：

先发报头长度，再编码报头内容然后发送，最后发真实内容

接收时：先收报头长度，用struct取出来，根据取出的长度收取报头内容，然后解码，反序列化，从反序列化的结果中取出待取数据的详细信息，然后去取真实的数据内容

服务端：

客户端：

客户端实现等待后重连：

import socketimport timewhile True: try: client = socket.socket(socket.AF_INET, socket.SOCK_STREAM) client.connect(('127.0.0.1',8080)) break except ConnectionRefusedError: time.sleep(3) print('等待3秒。。。')

最后多说一句，小编是一名python开发工程师，这里有我自己整理了一套最新的python系统学习教程，包括从基础的python脚本到web开发、爬虫、数据分析、数据可视化、机器学习等。想要这些资料的可以关注小编，并在后台私信小编：“01”即可领取。

weixin_40009207

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬虫结果是字节_python 之网络编程（基于TCP协议Socket通信的粘包问题及解决）...

粘包问题粘包问题发生的原因：1.发送端需要等缓冲区满才发送出去，造成粘包(发送数据时间间隔很短,数据了很小,会合到一起,产生粘包),这样接收端，就难于分辨出来了，必须提供科学的拆包机制。即面向流的通信是无消息保护边界的。2.接收方不及时接收缓冲区的包，造成多个包接收(客户端发送了一段数据，服务端只收了一小部分，服务端下次再收的时候还是从缓冲区拿上次遗留的数据，产生粘包)粘包问题主要还是因为接收方...
复制链接

扫一扫