python爬虫结果是字节_python 之网络编程(基于TCP协议Socket通信的粘包问题及解决)...

粘包问题

粘包问题发生的原因:

1.发送端需要等缓冲区满才发送出去,造成粘包(发送数据时间间隔很短,数据了很小,会合到一起,产生粘包),这样接收端,就难于分辨出来了,必须提供科学的拆包机制。 即面向流的通信是无消息保护边界的

2.接收方不及时接收缓冲区的包,造成多个包接收(客户端发送了一段数据,服务端只收了一小部分,服务端下次再收的时候还是从缓冲区拿上次遗留的数据,产生粘包)

粘包问题主要还是因为接收方不知道消息之间的界限,不知道一次性提取多少字节的数据所造成的。

aa24154e8f90caa85e4bbac5a1dd6b19.png

stract模块

1、把整型数字转成bytes类型 2、转成的bytes是固定长度的

e14c1023e60883e7c8dc62e669bd22d4.png

2 利用stract模块解决粘包

为字节流加上自定义固定长度报头,报头中包含字节流长度,然后一次send到对端,对端在接收时,先从缓存中取出定长的报头(报头中含有真实数据长度),然后再取真实数据

服务端:

2f520ebd611905fbac2b5a644fe94898.png

客户端:

139799bf50ab6543dd02604035028538.png

3.自定义报头

我们可以把报头做成字典,字典里包含将要发送的真实数据的详细信息,字典然后json序列化,编码成byte类型,然后用struck将数据长度打包成4个字节(4个自己足够用了)

发送时:

先发报头长度,再编码报头内容然后发送,最后发真实内容

接收时:先收报头长度,用struct取出来,根据取出的长度收取报头内容,然后解码,反序列化,从反序列化的结果中取出待取数据的详细信息,然后去取真实的数据内容

服务端:

客户端:

c852728b34e6eb9a6cee9d90cf67a638.png

客户端:

30e1377f4bf8018af9da01e35edcbd43.png

客户端实现等待后重连:

import socketimport time​while True: try: client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)​ client.connect(('127.0.0.1',8080)) break except ConnectionRefusedError: time.sleep(3) print('等待3秒。。。')

最后多说一句,小编是一名python开发工程师,这里有我自己整理了一套最新的python系统学习教程,包括从基础的python脚本到web开发、爬虫、数据分析、数据可视化、机器学习等。想要这些资料的可以关注小编,并在后台私信小编:“01”即可领取。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值