python requests 爬取网页通用框架

最新推荐文章于 2024-05-16 18:09:11 发布

YmeBtc

最新推荐文章于 2024-05-16 18:09:11 发布

阅读量605

点赞数

分类专栏： python基础文章标签： requests 网页爬取框架

本文链接：https://blog.csdn.net/YmeBtc/article/details/95330099

版权

python基础专栏收录该内容

87 篇文章 6 订阅

订阅专栏

#每天一点点，记录工作中实际可行操作#

python requests 爬取网页通用框架

import requests #调用库

def getHTMLText(url):#定义
    try:
        r = requests.get(url,timeout = 30) #请求url链接,限时30秒
        r.raise_for_status()#判断返回的内容是否正常
        #若状态不是200，引发httperror异常
        r.encoding = r.apparent_encoding#替代，使返回的解码是正确的
        return r.text
    except:
        return "异常"

if __name__ == "__main__":#前后都是双下划线
    url = "http://www.baidu.com"
    print(getHTMLText(url))

查看更多学习笔记就在 ? 我的github，点击可看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

YmeBtc

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
python requests 爬取网页通用框架

#每天一点点，记录工作中实际可行操作#python requests 爬取网页通用框架import requests #调用库def getHTMLText(url):#定义 try: r = requests.get(url,timeout = 30) #请求url链接,限时30秒 r.raise_for_status()#判断返回的内容是否正常...
复制链接

扫一扫