【Python 协程Coroutine异步爬虫】爬取猫咪图片

多线程以及多进程往往能实现爬虫速度的大幅提升,不过协程作为一个更加轻量化的方式可以以更小的代价实现高并发异步爬虫,当io操作越多事,其优势愈加明显。

在使用python的asyncio时,会遭遇需要调用已完成tasks的结果的情况,而实现的方法有两个,一个是add_done_callback(func())而另一个则是task.result()。这里使用第二种方法进行操作。

import aiohttp 
import asyncio 
from lxml import etree
import requests
import aiofiles

这里之所以设置两个header是因为在请求图片url下载时有防盗链,所有需要进行设置。 

headers = {
	'User-Agent' :'User-Agent=Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9) Gecko/20080705 Firefox/3.0 Kapiko/3.0',
	'host':'www.tooopen.com',
	'Accept-Language': 'en-USen;q=0.9',
	'accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',
	'accept-encoding':'gzip, deflate, br',
	'connection'
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值