16爬虫：python中的requests简单使用(自定义)

最新推荐文章于 2024-08-20 17:58:09 发布

gzg----rxq

最新推荐文章于 2024-08-20 17:58:09 发布

阅读量810

点赞数 1

本文链接：https://blog.csdn.net/gzgrxq521/article/details/81072770

版权

本文介绍了Python的requests库在爬虫中的基本使用，包括get和post请求、设置请求头、代理及超时设置。同时，详细列举了requests库常见的网络异常类型，如ConnectionError、HTTPError等。通过学习，可以掌握requests库进行HTTP请求的基础操作。

摘要由CSDN通过智能技术生成

理解request库的异常
requests.ConnectionError 网络连接异常，如DNS查询失败，拒绝连接等

requests.HTTPError: HTTP错误异常

requests.URLRequired: URL缺失异常

requests.TooManyRedirects: 超过最大重定向次数，产生重定向异常

requests.ConnectTimeout: 远程连接超时异常

requests.Timeout: 请求URL超时，产生超时异常

r.raise_for_status() 如果返回的状态码不是200，则会产生requests。HTTPError异常

一、requests.get()使用

#Python 的标准库 urllib 提供了大部分 HTTP 功能，但使用起来较繁琐。
#通常，我们会使用另外一个优秀的第三方库：Requests，它的标语是：Requests: HTTP for Humans。


import requests#创建requests模块
reponse=requests.get("https://www.baidu.com/")#首先调用requests的get方法
<class 'requests.models.Response'>
#print(type(response))列表

reponse.encoding='utf-8'#转换中文

# 返回状态码
print(reponse.status_code)
200

# 打印网页的内容
print(response.text)#不需要解码就可以直接打印信息print(response.cookies)
<RequestsCookieJar[<Cookie BDORZ=27315 for .baidu.com/>]>

结果如下

这里写图片描述

**requests库的基本方法：**

requests.request()     构造一个请求， 支撑以下各方法的基础方法
requests.get()    获取HTML网页的主要方法࿰

最低0.47元/天解锁文章

gzg----rxq

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫