爬取网页的通用代码框架

最新推荐文章于 2023-04-21 22:18:00 发布

小兔崽崽！

最新推荐文章于 2023-04-21 22:18:00 发布

阅读量132

点赞数

分类专栏： python爬虫

本文链接：https://blog.csdn.net/qq_43811879/article/details/103974705

版权

python爬虫专栏收录该内容

6 篇文章 0 订阅

订阅专栏

import requests

def getHTMLText(url):
    try:
        r = requests.get(url,timeout = 30)
        r.raise_for_status()#如果状态不是200，将引发HTTPEorro异常
        r.encoding  = r.apparent_encoding
        return r.text
    except:
        return "产生异常"

if __name__ == '__main__':
    url = "http://www.icourse163.org"
    print(getHTMLText(url))

在这里插入图片描述

小兔崽崽！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬取网页的通用代码框架

import requestsdef getHTMLText(url): try: r = requests.get(url,timeout = 30) r.raise_for_status()#如果状态不是200，将引发HTTPEorro异常 r.encoding = r.apparent_encoding retur...
复制链接

扫一扫

专栏目录