socket概念
socket
套接字,一种独立于协议的网络编程接口,就是对网络中不同主机上的应用进程之间进行双向通信的端点。
TCP
把连接作为最基本的对象,每一条TCP
连接都有两个端点,这种端点我们叫作套接字(socket
)。
IP层的ip地址可以唯一标示主机,而TCP
层协议和端口号可以唯一标示主机的一个进程,这样我们可以利用ip地址+协议+端口号唯一标示网络中的一个进程。 能够唯一标示网络中的进程后,它们就可以利用socket
进行通信了
socket
起源于Unix,而Unix/Linux基本哲学之一就是“一切皆文件”,对于文件用【打开】【读写】【关闭】模式来操作。socket就是该模式的一个实现,socket
即是一种特殊的文件,一些socket函数就是对其进行的操作(读/写IO、打开、关闭)
Python 提供了两个基本的 socket
模块。
-
第一个是
Socket
,它提供了标准的BSD Sockets API
。 -
第二个是
SocketServer
, 它提供了服务器中心类,可以简化网络服务器的开发。
socket编程
socket是基于C/S架构的,也就是说进行socket网络编程,通常需要编写两个py文件,一个服务端,一个客户端。
首先,导入Python中的socket模块: import socket
Python中的socket通信逻辑如下图所示:
在Python中,import socket
后,用socket.socket()
方法来创建套接字,语法格式如下:
sk = socket.socket([family[, type[, proto]]])
参数说明:
- family: 套接字家族,可以使
AF_UNIX
或者AF_INET
。 - type: 套接字类型,根据是面向连接的还是非连接分为
SOCK_STREAM
或SOCK_DGRAM
,也就是TCP和UDP的区别。 - protocol: 一般不填默认为0。
直接socket.socket(),则全部使用默认值。
下面是具体的参数定义:
socket类型 | 描述 |
---|---|
socket.AF_UNIX | 只能够用于单一的Unix系统进程间通信 |
socket.AF_INET | IPv4 |
socket.AF_INET6 | IPv6 |
socket.SOCK_STREAM | 流式socket , for TCP |
socket.SOCK_DGRAM | 数据报式socket , for UDP |
socket.SOCK_RAW | 原始套接字,普通的套接字无法处理ICMP、IGMP等网络报文,而SOCK_RAW可以;其次,SOCK_RAW也可以处理特殊的IPv4报文;此外,利用原始套接字,可以通过IP_HDRINCL套接字选项由用户构造IP头。 |
socket.SOCK_SEQPACKET | 可靠的连续数据包服务 |
创建TCP Socket: | s=socket.socket(socket.AF_INET,socket.SOCK_STREAM) |
创建UDP Socket: | s=socket.socket(socket.AF_INET,socket.SOCK_DGRAM) |
通过s = socket.socket()
方法,我们可以获得一个socket对象s,也就是通常说的获取了一个“套接字”,该对象具有一下方法:
socket函数 | 描述 |
---|---|
服务端socket函数 | |
s.bind(address) | 将套接字绑定到地址, 在AF_INET下,以元组(host,port)的形式表示地址. |
s.listen(backlog) | 开始监听TCP传入连接。backlog指定在拒绝连接之前,操作系统可以挂起的最大连接数量。该值至少为1,大部分应用程序设为5就可以了。 |
s.accept() | 接受TCP连接并返回(conn,address),其中conn是新的套接字对象,可以用来接收和发送数据。address是连接客户端的地址。 |
客户端socket函数 | |
s.connect(address) | 连接到address处的套接字。一般address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。 |
s.connect_ex(adddress) | 功能与connect(address)相同,但是成功返回0,失败返回errno的值。 |
公共socket函数 | |
s.recv(bufsize[,flag]) | 接受TCP套接字的数据。数据以字符串形式返回,bufsize指定要接收的最大数据量。flag提供有关消息的其他信息,通常可以忽略。 |
s.send(string[,flag]) | 发送TCP数据。将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。 |
s.sendall(string[,flag]) | 完整发送TCP数据。将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。 |
s.recvfrom(bufsize[.flag]) | 接受UDP套接字的数据。与recv()类似,但返回值是(data,address)。其中data是包含接收数据的字符串,address是发送数据的套接字地址。 |
s.sendto(string[,flag],address) | 发送UDP数据。将数据发送到套接字,address是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。 |
s.close() | 关闭套接字。 |
s.getpeername() | 返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。 |
s.getsockname() | 返回套接字自己的地址。通常是一个元组(ipaddr,port) |
s.setsockopt(level,optname,value) | 设置给定套接字选项的值。 |
s.getsockopt(level,optname[.buflen]) | 返回套接字选项的值。 |
s.settimeout(timeout) | 设置套接字操作的超时期,timeout是一个浮点数,单位是秒。值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如connect()) |
s.gettimeout() | 返回当前超时期的值,单位是秒,如果没有设置超时期,则返回None。 |
s.fileno() | 返回套接字的文件描述符。 |
s.setblocking(flag) | 如果flag为0,则将套接字设为非阻塞模式,否则将套接字设为阻塞模式(默认值)。非阻塞模式下,如果调用recv()没有发现任何数据,或send()调用无法立即发送数据,那么将引起socket.error异常。 |
s.makefile() | 创建一个与该套接字相关连的文件 |
注意事项:
- Python3以后,socket传递的都是bytes类型的数据,字符串需要先转换一下,
string.encode()
即可;另一端接收到的bytes数据想转换成字符串,只要bytes.decode()
一下就可以。 - 在正常通信时,
accept()
和recv()
方法都是阻塞的。所谓的阻塞,指的是程序会暂停在那,一直等到有数据过来。
socket编程思路:
服务端:
- 创建套接字,绑定套接字到本地IP与端口:socket.socket(socket.AF_INET,socket.SOCK_STREAM) , s.bind()
- 开始监听连接:s.listen()
- 进入循环,不断接受客户端的连接请求:s.accept()
- 接收传来的数据,或者发送数据给对方:s.recv() , s.sendall()
- 传输完毕后,关闭套接字:s.close()
客户端:
- 创建套接字,连接服务器地址:socket.socket(socket.AF_INET,socket.SOCK_STREAM) , s.connect()
- 连接后发送数据和接收数据:s.sendall(), s.recv()
- 传输完毕后,关闭套接字:s.close()
Python的socket编程,通常可分为TCP和UDP编程两种,前者是带连接的可靠传输服务,每次通信都要握手,结束传输也要挥手,数据会被检验,是使用最广的通用模式;后者是不带连接的传输服务,简单粗暴,不加控制和检查的一股脑将数据发送出去的方式,但是传输速度快,通常用于安全和可靠等级不高的业务场景,比如文件下载。
TCP编程
服务器端:
import socket
def socket_server(port):
sk = socket.socket() # 创建套接字
sk.bind(port) # 绑定服务地址
sk.listen(5) # 监听连接请求
print('启动socket服务,等待客户端连接...')
conn, address = sk.accept() # 等待连接,此处自动阻塞
while True: # 一个死循环,直到客户端发送‘exit’的信号,才关闭连接
client_data = conn.recv(1024).decode() # 接收信息
if client_data == "exit": # 判断是否退出连接
exit("通信结束")
print("来自%s的客户端向你发来信息:%s" % (address, client_data))
conn.sendall('服务器已经收到你的信息'.encode()) # 回馈信息给客户端
sk.close() # 关闭连接
if __name__ == "__main__":
ip_port = ('127.0.0.1', 9999)
socket_server(ip_port)
客户端:
import socket
def socket_client(port):
s = socket.socket() # 创建套接字
s.connect(port) # 连接服务器
while True: # 通过一个死循环不断接收用户输入,并发送给服务器
inp = input("请输入要发送的信息: ").strip()
if not inp: # 防止输入空信息,导致异常退出
continue
s.sendall(inp.encode())
if inp == "exit": # 如果输入的是‘exit’,表示断开连接
print("结束通信!")
break
server_reply = s.recv(1024).decode()
print(server_reply)
s.close() # 关闭连接
if __name__ == '__main__':
ip_port = ('127.0.0.1', 9999)
socket_client(ip_port)
上面这个例子,基本能够展示出socket通信的机制。套接字的创建和关闭,服务器的绑定和监听,客户端的连接,这些都是固定套路,没什么难点。关键之处在于循环内部的收发逻辑,这里才是重点,需要根据你自己的业务需求,正确编写。这个过程中,一定要注意,收发是一一对应的,有发就要有收,并且recv()方法默认是阻塞的。
虽然服务器和客户端在一对一的情况下,工作良好,但是,如果有多个客户端同时连接同一个服务器呢?结果可能不太令人满意,因为服务器无法同时对多个客户端提供服务。为什么会这样呢?因为Python的socket模块,默认情况下创建的是单进程单线程,同时只能处理一个连接请求,如果要实现多用户服务,那么需要使用多线程机制。
服务器端(多线程):
import socket
import threading
def link_handler(link, client):
"""
该函数为线程需要执行的函数,负责具体的服务器和客户端之间的通信工作
:param link: 当前线程处理的连接
:param client: 客户端ip和端口信息,一个二元元组
:return: None
"""
print("服务器开始接收来自[%s:%s]的请求...." % (client[0], client[1]))
while True: # 利用一个死循环,保持和客户端的通信状态
client_data = link.recv(1024).decode()
if client_data == "exit":
print("结束与[%s:%s]的通信..." % (client[0], client[1]))
break
print("来自[%s:%s]的客户端向你发来信息:%s" % (client[0], client[1], client_data))
link.sendall('服务器已经收到你的信息'.encode())
link.close()
def socket_thread(port):
sk = socket.socket() # 创建套接字
sk.bind(port) # 绑定服务地址
sk.listen(5) # 监听连接请求
print('启动socket服务,等待客户端连接...')
while True: # 一个死循环,不断的接受客户端发来的连接请求
conn, address = sk.accept() # 等待连接,此处自动阻塞
# 每当有新的连接过来,自动创建一个新的线程,
# 并将连接对象和访问者的ip信息作为参数传递给线程的执行函数
t = threading.Thread(target=link_handler, args=(conn, address))
t.start()
if __name__ == '__main__':
ip_port = ('127.0.0.1', 9999)
socket_thread(ip_port)
UDP编程:
相对TCP编程,UDP编程就简单多了,当然可靠性和安全性也差很多。由于UDP没有握手和挥手的过程,因此accept()和connect()方法都不需要。
服务器端:
import socket
def udp_server(port):
sk = socket.socket(socket.AF_INET, socket.SOCK_DGRAM, 0)
sk.bind(port)
print('启动socket服务,等待客户端连接...')
while True:
data = sk.recv(1024).strip().decode()
print("来自的客户端向你发来信息:%s" % data)
if data == "exit":
print("客户端主动断开连接!")
break
sk.close()
if __name__ == '__main__':
port = ('127.0.0.1', 9999)
udp_server(port)
客户端:
import socket
def udp_client(port):
sk = socket.socket(socket.AF_INET, socket.SOCK_DGRAM, 0)
while True:
inp = input('发送的消息:').strip()
sk.sendto(inp.encode(), port)
if inp == 'exit':
break
sk.close()
if __name__ == '__main__':
port = ('127.0.0.1', 9999)
udp_client(port)