python学习——爬虫request异常代码

最新推荐文章于 2022-10-14 14:12:54 发布

尹天仇沙雕

最新推荐文章于 2022-10-14 14:12:54 发布

阅读量382

点赞数

分类专栏： Python笔记

本文链接：https://blog.csdn.net/leon1827/article/details/91050096

版权

Python笔记专栏收录该内容

10 篇文章 0 订阅

订阅专栏

一、网上摘录的https://blog.csdn.net/xunkhun/article/details/79349621

def getHTMLText(url):
    try:
        r = requests.get(url)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return "产生异常"

r.raise_for_status()会跑出异常，没有异常则是None。抓取一切异常

二、自己用的，也是抄袭这位博文（https://blog.csdn.net/polyhedronx/article/details/81589196）

def get_text_from_url(url):
    # 从链接中获取网页文本
    try:
        response = requests.get(url, headers=headers, timeout=30)
        if response.status_code == 200:
            return response.text
        else:
            print('get page failed.', response.status_code)
            return None
    except (ConnectionError, TimeoutError) as e:
        print('crawling failed', url, e)
        return None

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

尹天仇沙雕

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python学习——爬虫request异常代码

一、网上摘录的https://blog.csdn.net/xunkhun/article/details/79349621def getHTMLText(url): try: r = requests.get(url) r.raise_for_status() r.encoding = r.apparent_encoding ...
复制链接

扫一扫