Requests库的get()方法

最新推荐文章于 2024-04-19 14:42:15 发布

没有如果ru果

最新推荐文章于 2024-04-19 14:42:15 发布

阅读量3.1k

点赞数 1

分类专栏： Python网络爬虫与信息提取文章标签： python

本文链接：https://blog.csdn.net/cxrpty/article/details/105938030

版权

Python网络爬虫与信息提取专栏收录该内容

4 篇文章 3 订阅

订阅专栏

获取一个网页最简单的方法就是：构造一个向服务器请求资源的Request对象，返回一个Response对象即r，其包含从服务器返回的所有的相关资源

r = requests.get(url)

requests.get()完整的使用方法有三个参数

requests.get(url,params=None，**kwargs)
url：获取页面的url链接
params：url中的额外参数，字典或字节流格式，可选
**kwargs：12个控制访问的参数，可选

Response对象

Response对象包含了爬虫返回的全部内容

Response对象最常用和最必要的属性

使用get方法获取网络资源的基本流程

首先用r.status_code来检查返回的Response对象的状态，如果状态是200，就可以用r.text、r.encoding、r.apparent_encoding和r.content等解析返回的内容；如果返回的状态码是404或者其他，那就说明我们这次url的访问因为某种原因出错或产生异常了

实例：

#coding:utf-8
import requests
# 调用request库
r = requests.get("http://www.baidu.com")
# 用get方法去访问百度的主页
print(r.status_code)
# 用r.status_code来检测这个请求的状态码，如果状态码是200，说明访问成功；如果不是200，访问失败
print type(r)
# 用type检测r的类型，可以看到返回的是一个类，这个类的名是Response
print (r.headers)
# 用r.headers获取页面的头部信息

没有如果ru果

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
Requests库的get()方法

获取一个网页最简单的方法就是：构造一个向服务器请求资源的Request对象，返回一个Response对象即r，其包含从服务器返回的所有的相关资源r = requests.get(url)requests.get()完整的使用方法有三个参数requests.get(url,params=None，**kwargs)url：获取页面的url链接params：url中的额外参数，...
复制链接

扫一扫