python asyncio 使用ThreadPoolExecutor和asyncio完成阻塞IO请求

#使用多线程:在协程中集成阻塞io
import asyncio
from concurrent.futures import ThreadPoolExecutor
import socket
from urllib.parse import urlparse


def get_url(url):
    #通过socket请求html
    url = urlparse(url)
    host = url.netloc
    path = url.path
    if path == "":
        path = "/"

    #建立socket连接
    client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    # client.setblocking(False)
    client.connect((host, 80)) #阻塞不会消耗cpu

    #不停的询问连接是否建立好, 需要while循环不停的去检查状态
    #做计算任务或者再次发起其他的连接请求

    client.send("GET {} HTTP/1.1\r\nHost:{}\r\nConnection:close\r\n\r\n".format(path, host).encode("utf8"))

    data = b""
    while True:
        d = client.recv(1024)
        if d:
            data += d
        else:
            break

    data = data.decode("utf8")
    html_data = data.split("\r\n\r\n")[1]
    print(html_data)
    client.close()


# 如果在协程中要用到阻塞IO,就把他放到线程池里面去运行,在运行的时候,本质还是线程池,同步的
if __name__ == "__main__":
    import time
    start_time = time.time()
    loop = asyncio.get_event_loop()
    executor = ThreadPoolExecutor(3)
    tasks = []
    for url in range(20):
        url = "http://shop.projectsedu.com/goods/{}/".format(url)
        task = loop.run_in_executor(executor, get_url, url)
        tasks.append(task)
    loop.run_until_complete(asyncio.wait(tasks))
    print("last time:{}".format(time.time()-start_time))

 

转载于:https://www.cnblogs.com/callyblog/p/11220572.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python中的`concurrent.futures.ThreadPoolExecutor`是一个很有用的工具,它能够方便地管理和执行线程池中的任务。然而,有时候我们可能需要找到替代品来满足不同需求或解决一些ThreadPoolExecutor存在的缺点。 1. `concurrent.futures.ProcessPoolExecutor`:`ProcessPoolExecutor`提供了与`ThreadPoolExecutor`类似的功能,但它使用进程而不是线程来执行任务。由于Python的全局解释器锁(GIL)的限制,使用进程来并行执行任务可能会比使用线程更有效。因此,当处理CPU密集型任务时,这个替代品可能是更好的选择。 2. `asyncio`:`asyncio`是Python 3.7及以上版本中引入的标准库,它提供了协程(coroutine)和事件循环(event loop)的支持。与传统的线程池不同,`asyncio`基于单个线程的事件循环和非阻塞IO操作来实现并发。通过使用异步编程的范式,`asyncio`可以实现高效的并发处理。因此,对于高并发网络应用程序,`asyncio`可以作为`ThreadPoolExecutor`的替代品。 3. `ray`:`ray`是一个开源的分布式计算框架,它可用于构建高性能和可伸缩的应用程序。`ray`提供了丰富的并行计算API,包括支持任务并行化的基于Actor模型的编程模型。相比于`ThreadPoolExecutor`,`ray`具有更强大的功能,可以在分布式集群上执行任务。 总的来说,`concurrent.futures.ThreadPoolExecutor`是一个很实用的工具,但在一些特定场景下可能需要找到适合的替代品。`ProcessPoolExecutor`、`asyncio`和`ray`是Python中一些常见的替代方案,可以根据具体需求选择合适的工具来实现并发和并行计算。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值