装饰器用在爬虫即retrying模块的安装

最新推荐文章于 2022-03-26 19:35:31 发布

VIP文章 winnertakeall

最新推荐文章于 2022-03-26 19:35:31 发布

阅读量303

点赞数

分类专栏： python 文章标签：源码安装 retrying

本文链接：https://blog.csdn.net/winnertakeall/article/details/86603180

版权

import requests
from retrying import retry
headers={"User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36"}

@retry(stop_max_attempt_number=3)
def _parse_url(url,method,data,proxies):
    print("*"*20)
    if method=="POST":
        response = requests.post(url,data=data,headers=headers,proxies=proxies)
    else:
        response = requests.get(url,headers=headers,timeout=3,proxies=proxies)
    assert  response.status_code == 200
    return response.content.decode()


def parse_url(url,method="GET",data=None,proxies={}):
    try:
        html_str = _parse_url(url,method,data,proxies)
    except:
        html_str = None

    return html_str

if __name__ == '__main__':
    url = "www.baidu.com"
    print(parse_url(url))


******************

最低0.47元/天解锁文章

优惠劵

winnertakeall

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
装饰器用在爬虫即retrying模块的安装

import requestsfrom retrying import retryheaders={"User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36"}@retry(st...
复制链接

扫一扫