select
select函数监视的描述符分为三类wrtefds
, readfds
, exceptfds
。调用后select函数会被阻塞,直到有描述符就绪(有数据可读,可写,抛出exception),或者超时,select函数返回,当select函数返回时,可以通过遍历fdset
来找到就绪的描述符进行后续操作
缺点是select在单个进程中能够监视的描述符存在数量限制,Linux中为1024(可以通过重新编译内核的方式进行修改),并且select需要通过遍历的方式寻找就绪的描述符
poll
不同于select使用三个位图来表示三个fdset(readfds
, writefds
, exceptfds
),poll使用pollfd
的指针实现
pollfd结构中包括要监视的event
和发生的event
,不再使用select参数-值
传递的方式【并看不懂】。同时pollfd没有最大数量的限制(当然,随着监视的描述符数量增长,性能也会下降),和select一样,poll返回后,也需要通过轮询pollfd来获取就绪的描述符
epoll
epoll没有文件描述符的限制(数据结构使用红黑树),epoll使用一个文件描述符管理多个描述符,将用户关系的文件描述符的事件存放到内核的一个事件表中,这样在用户空间和内核空间的copy只需要一次【也并看不懂】
实现非阻塞io
#!/usr/bin/env python3
import socket
from selectors import DefaultSelector, EVENT_WRITE, EVENT_READ
selector = DefaultSelector() # 该类会根据os的不同而使用select、epoll
class Fetch:
def __init__(self):
self.host = 'www.baidu.com'
self.port = 80
self.req = f'GET {"/"} HTTP/1.1\r\nHost: {self.host}\r\nConnection: close\r\n\r\n'
self.data = b''
def has_received(self, key):
buffer = self.client.recv(1024)
if buffer:
self.data += buffer
else:
selector.unregister(key.fd)
print(self.data.decode('utf8'))
def has_connected(self, key):
"""
key: 就绪的文件描述符
"""
selector.unregister(key.fd) # 当该文件描述符就绪后,从监听列表中移除,因为后续还需要监听client的EVENT_READ事件
self.client.send(self.req.encode('utf8'))
selector.register(self.client.fileno(), EVENT_READ, self.has_received)
def get_html(self):
self.client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
self.client.setblocking(False)
try:
self.client.connect((self.host, self.port))
except BlockingIOError:
pass
selector.register(self.client.fileno(), EVENT_WRITE, self.has_connected) # 添加self.client到监听列表中,当EVENT_WRITE事件发生时,触发回调函数
# 单线程
def loop_forever():
# 事件循环
while True:
ready = selector.select() # list
for key, mask in ready:
call_back = key.data # 回调函数
# print(call_back.__name__)
call_back(key)
if __name__ == '__main__':
fetch = Fetch()
fetch.get_html()
loop_forever()