socket
什么是socket
Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口。在设计模式中,Socket其实就是一个门面模式,它把复杂的TCP/IP协议族隐藏在Socket接口后面,对用户来说,一组简单的接口就是全部,让Socket去组织数据,以符合指定的协议。所以,我们无需深入理解tcp/udp协议,socket已经为我们封装好了,我们只需要遵循socket的规定去编程,写出的程序自然就是遵循tcp/udp标准的。
套接字有两种:基于文件型的和基于网络型的
基于文件型的套接字家族
套接字家族的名字:AF_UNIX
unix一切皆文件,基于文件的套接字调用的就是底层的文件系统来取数据,两个套接字进程运行在同一机器,可以通过访问同一个文件系统间接完成通信
基于网络型的套接字家族
套接字家族的名字:AF_INET
(还有AF_INET6被用于ipv6,还有一些其他的地址家族,不过,他们要么是只用于某个平台,要么就是已经被废弃,或者是很少被使用,或者是根本没有实现,所有地址家族中,AF_INET是使用最广泛的一个,python支持很多种地址家族,但是由于我们只关心网络编程,所以大部分时候我么只使用AF_INET)
基于TCP的套接字
TCP是面向连接的,必须先启动服务器然后启动客户端。
粘包问题
所谓粘包问题主要还是因为接收方不知道消息之间的界限,不知道一次性提取多少字节的数据所造成的。
只有TCP有粘包现象,UDP永远不会粘包:
- TCP(transport control protocol,传输控制协议)是面向连接的,面向流的,提供高可靠性服务。收发两端(客户端和服务器端)都要有一一成对的socket,因此,发送端为了将多个发往接收端的包,更有效的发到对方,使用了优化方法(Nagle算法),将多次间隔较小且数据量小的数据,合并成一个大的数据块,然后进行封包。这样,接收端,就难于分辨出来了,必须提供科学的拆包机制。 即面向流的通信是无消息保护边界的。
- UDP(user datagram protocol,用户数据报协议)是无连接的,面向消息的,提供高效率服务。不会使用块的合并优化算法,, 由于UDP支持的是一对多的模式,所以接收端的skbuff(套接字缓冲区)采用了链式结构来记录每一个到达的UDP包,在每个UDP包中就有了消息头(消息来源地址,端口等信息),这样,对于接收端来说,就容易进行区分处理了。 即面向消息的通信是有消息保护边界的。
- tcp是基于数据流的,于是收发的消息不能为空,这就需要在客户端和服务端都添加空消息的处理机制,防止程序卡住,而udp是基于数据报的,即便是你输入的是空内容(直接回车),那也不是空消息,udp协议会帮你封装上消息头,实验略
发生粘包的原因:
发送方发送消息时间间隔短,接收方一次性接收了好几条(可能不完整的消息)
接收方未及时接收,导致发送方发送的消息阻滞在管道里,当接收的时候一下接收好多。
解决粘包问题的思路:
为字节流加上自定义固定长度报头,报头中包含字节流长度,然后一次send到对端,对端在接收时,先从缓存中取出定长的报头,然后再取真实数据
具体实现:
我们可以把报头做成字典,字典里包含将要发送的真实数据的详细信息,然后json序列化,然后用struck将序列化后的数据长度打包成4个字节(4个自己足够用了)
发送时:
先发报头长度
再编码报头内容然后发送
最后发真实内容
接收时:
先收报头长度,用struct取出来
根据取出的长度收取报头内容,然后解码,反序列化
从反序列化的结果中取出待取数据的详细信息,然后去取真实的数据内容
#service.py
import socket
import struct
import subprocess
import json
service = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
service.bind(('127.0.0.1', 8848))
service.listen(5)
print('-------starting---->')
while True: # 链接循环
conn, client_addr = service.accept()
print(client_addr)
while True: # 通信循环
try:
# 1.收命令
cmd = conn.recv(8096)
if not cmd: continue
# 2 执行命令,拿到结果
obj = subprocess.Popen(cmd.decode('utf-8'), shell=True,
stdout=subprocess.PIPE,
stderr=subprocess.PIPE)
stdout = obj.stdout.read()
stderr = obj.stderr.read()
# 3 把命令结果返回客户端
# 第一步,制作固定长度的报头
head_dic = {
'filename': 'a.txt',
'md5': 'xxxxxxx',
'total_size': len(stdout) + len(stderr)
}
head_json = json.dumps(head_dic)
head_byte = head_json.encode('utf-8')
# 第二步 先发送报头长度
conn.send(struct.pack('i', len(head_byte)))
# 第三步 再发报头
conn.send(head_byte)
# 再发送真实数据
conn.send(stdout)
conn.send(stderr)
except ConnectionResetError as e:
print(e)
break
conn.close()
service.close()
#client.py
import socket
import struct
import json
client = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
client.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1)
client.connect(('127.0.0.1',8848))
while True:
# 1 发命令
cmd = input('>>>').strip()
client.send(cmd.encode('utf-8'))
# 2 拿命令结果并打印
# 第一步,先收报头长度
obj = client.recv(4)
head_size = struct.unpack('i',obj)[0]
# 第二步,再收报头
head_byte = client.recv(head_size)
# 第三步,在报头中解析出真实数据的描述信息
head_json = head_byte.decode('utf-8')
head_dic = json.loads(head_json)
# print(head_dic)
total_size = head_dic['total_size']
# 第四步 接收真实数据
recv_size = 0
recv_bytes = b''
while recv_size < total_size:
res = client.recv(1024)
recv_size += len(res)
recv_bytes += res
print(recv_bytes.decode('gbk'))
phone.close()
注意:
obj=subprocess.Popen(cmd.decode('utf-8'),shell=True,
stderr=subprocess.PIPE,
stdout=subprocess.PIPE)
的结果的编码是以当前所在的系统为准的,如果是windows,那么res.stdout.read()读出的就是GBK编码的,在接收端需要用GBK解码
且只能从管道里读一次结果
基于UDP的套接字
udp是无链接的,先启动哪一端都不会报错
套接字简单示例
#udp服务端
#_*_coding:utf-8_*_
__author__ = 'Linhaifeng'
import socket
ip_port=('127.0.0.1',9000)
BUFSIZE=1024
udp_server_client=socket.socket(socket.AF_INET,socket.SOCK_DGRAM)
udp_server_client.bind(ip_port)
while True:
msg,addr=udp_server_client.recvfrom(BUFSIZE)
print(msg,addr)
udp_server_client.sendto(msg.upper(),addr)
#udp客户端
#_*_coding:utf-8_*_
__author__ = 'Linhaifeng'
import socket
ip_port=('127.0.0.1',9000)
BUFSIZE=1024
udp_server_client=socket.socket(socket.AF_INET,socket.SOCK_DGRAM)
while True:
msg=input('>>: ').strip()
if not msg:continue
udp_server_client.sendto(msg.encode('utf-8'),ip_port)
back_msg,addr=udp_server_client.recvfrom(BUFSIZE)
print(back_msg.decode('utf-8'),addr)