套接字(Socket)编程
1 套接字介绍
套接字(Socket)是把OSI模型中从传输层到物理层封装起来的抽象层,把网络协议隐藏在Socket抽象层内,只对使用者暴露使用接口,使用者只需考虑应用层的数据即可。
1.1 基于TCP协议的套接字编程
- 创建套接字对象
socket.socket(family, type, proto)
参数
family:套接字家族,AF_UNIX (同一台主机上不同进程之间的文件传输) 和 AF_INET (网络通信);
type:套接字类型,数据流协议SOCK_STREAM 和 数据报协议SOCK_DGRAM;
protocol:一般不填,默认为0。
import socket
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
- 服务端
bind() 绑定地址;
listen() 监听TCP客户端的连接请求(将连接请求放入半连接池中),参数为半连接池的容量,至少为1,一般为5;
accept() 以阻塞的方式等待并被动接受客户端连接(从半连接池中取出一个客户端连接请求并建立连接)。
- 客户端
connect() 主动申请服务器连接,参数一般为元组 (hostname, port)。
服务端accept()从半连接池中取出客户端连接请求,与客户端connect()进行三次握手。
- 公共方法
recv() 接收数据,以字符串形式返回,参数为指定的接收最大数据量;
send() 发送数据,返回值是发送数据的字节数;
close() 关闭套接字。
会引发明显阻塞的操作是 accept() 和 recv()。
服务端
import socket
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
s.bind(('127.0.0.1', 8080)) # 参数为元组(ip, port) ip使用回环地址127.0.0.1
s.listen(5) # 参数表示半连接池的容量为5
# 等待连接请求
conn, addr = s.accept() # conn是用于接收和发送数据的对象,addr是客户端ip地址和端口号
print(f'客户端ip地址和端口号分别为:{addr}')
recv_data = conn.recv(1024) # 参数表示最大接收数据量为1024Bytes
recv_data = recv_data.decode("utf-8")
print(f'来自客户端的数据:{recv_data}')
conn.send(recv_data.upper().encode('utf-8'))
conn.close() # 关闭本次连接(必须)
s.close() # 相当于关闭服务端
客户端
import socket
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
s.connect(('127.0.0.1', 8080))
send_data = input('>>>').strip()
s.send(send_data.encode('utf-8'))
recv_data = s.recv(1024)
print(recv_data.decode('utf-8'))
s.close()
1.2 两个循环
客户端需要循环做的事情
- 不停地从半连接池中取出一个连接请求,并建立连接;
- 基于建成的连接与客服端进行通信。
1.3 问题
1.3.1 问题1 空数据
如果客户端发送的是空数据(空字符串),相当于没有发送数据,服务端就不会接收到来自客户端的数据(recv),因此不会做出回应(send)。
此时客户端也不会接收到来自服务端的数据(recv),产生阻塞现象。
解决方案:客户端在发送前对空数据进行判断。
1.3.2 问题2 客户端强制退出
客户端非正常退出时,服务端会产生问题。
服务端在Linux系统中,服务端会陷入不断接收空数据的死循环中,解决方法是判断服务端接收的数据是否为空,如果是空,就可以结束这次连接(跳出while循环);
服务端在Windows系统中,服务端会抛出异常ConnectionResetError,解决方法是使用异常处理机制处理异常。
服务端
import socket
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 在bind前添加,用于重用ip地址和端口号
# s.setsockopt(SOL_SOCKET, SO_REUSEADDR, 1)
s.bind(('127.0.0.1', 8080))
s.listen(5)
# 循环1 连接循环,保证客户端能一直对外提供服务
while True:
conn, addr = s.accept()
# 循环2 通信循环,满足客户端的需求
while True:
# Windows系统中处理客户端非正常退出时抛出的的异常
try:
data = conn.recv(1024)
# Linux系统中避免客户端非正常退出导致的死循环
if len(data) == 0:
break
data = data.decode('utf-8')
print(f'来自客户端的数据:{data}')
conn.send(data.upper().encode('utf-8'))
except Exception:
break
conn.close()
s.close() # 一般不需要终止客户端
客户端
import socket
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
s.connect(('127.0.0.1', 8080))
while True:
send_data = input('>>>').strip()
if len(send_data) == 0:
continue
s.send(send_data.encode('utf-8'))
recv_data = s.recv(1024)
print(recv_data.decode('utf-8'))
s.close()
1.2 基于UDP协议的套接字编程
服务端
import socket
s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM) # UDP协议使用数据包协议
s.bind(('127.0.0.1', 8080))
while True:
data, addr = s.recvfrom(1024)
data = data.decode('utf-8')
s.sendto(data.upper().encode('utf-8'), addr)
# addr是客户端的ip地址和端口号
# UDP协议没有建立连接,每次发送数据都需要地址。
s.close()
客户端
import socket
s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
while True:
send_data = input('>>>').strip()
s.sendto(send_data.encode('utf-8'), ('127.0.0.1', 8080))
recv_data, addr = s.recvfrom(1024)
print(recv_data.decode('utf-8'))
s.close()
基于UDP协议的套接字编程:
- 允许发送空数据
TCP协议基于数据流协议,数据像水流一样不停地传输,因此rece()无法直接判断数据的开始与结束,如果未收到数据,就一直处于等待状态;
UDP协议基于数据报协议,数据报包括报头和内容,每一次发送和接收都是一个完整的整体,如果是空数据,则会将空数据与报头等信息打包一起发送和接收,因此rece()可以接受空数据。 - 客户端非正常退出时不影响服务端,因为客户端与服务端之间未建立稳定连接。