aiohttp使用

最新推荐文章于 2024-05-11 08:02:56 发布

qq_34272745

最新推荐文章于 2024-05-11 08:02:56 发布

阅读量207

点赞数

分类专栏：爬虫

本文链接：https://blog.csdn.net/qq_34272745/article/details/108392068

版权

爬虫专栏收录该内容

18 篇文章 0 订阅

订阅专栏

import requests
import re
import time
from lxml import etree
# 导入线程池模块对应的类
from multiprocessing.dummy import Pool
import asyncio
# 使用该模块中的一个ClienSession对象进行网络化请求
import aiohttp

start = time.time()
urls = [
    'www.baidu.com', 'www.csdn.com', 'www.bilibili.com'
]

async def get_page(url):
    # requests.get()是基于同步模块的代码，导致异步中断,必须使用基于异步的网络请求模块
    # aiohttp:基于异步网络请求的模块
    # response = requests.get(url=url)
    # 所有的with前都要有async修饰
    async with aiohttp.ClientSession() as session:
        # 阻塞操作需要await挂起
        # get()、post()
        # headers自定义头信息UA伪装,params\data,proxy='//ip:port'(是一个字符串)
        async with await session.get(url) as response:
            # text()返回字符串形式的响应数据
            # read()返回二进制形式的响应数据
            # json()返回的就是json对象
            # 在获取响应数据之前一定要使用await进行手动挂起
            page_text = await response.text()
            print(page_text)

tasks = []

for url in urls:
    c = get_page(url)
    # 将协程对象封装到任务对象中
    task = asyncio.ensure_future(c)
    tasks.append(task)

loop = asyncio.get_event_loop()
loop.run_until_complete(asyncio.wait(tasks))

end = time.time()
print(end-start)

qq_34272745

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
aiohttp使用

import requestsimport reimport timefrom lxml import etree# 导入线程池模块对应的类from multiprocessing.dummy import Poolimport asyncio# 使用该模块中的一个ClienSession对象进行网络化请求import aiohttpstart = time.time()urls = [ 'www.baidu.com', 'www.csdn.com', 'www.bilibil
复制链接

扫一扫