Python的爬虫模块：Requests介绍(1)

编程的杰哥

已于 2023-12-05 12:08:02 修改

阅读量977

点赞数 7

文章标签：爬虫 python

于 2023-12-01 13:12:19 首次发布

本文链接：https://blog.csdn.net/2301_81390499/article/details/134731995

版权

Requests库是Python的一个工具库，可以请求网页，提取信息，善于网络爬虫。但是它是Python的第三方库，需要pip下载安装第三方库：

python -m pip install requests

Requests有许多功能和函数，比UrlLib库更简洁。让我们更容易写爬虫代码。

用get(网址)函数可以请求网页，.text获取它的信息。

以下是Requests第三方库的更多响应信息：

属性与方法	使用方法
apparent_encoding	编码方式
close()	关闭与服务器的连接
content	返回响应的内容，以字节为单位
cookies	返回一个 CookieJar 对象，包含了从服务器发回的 cookie
elapsed	返回一个 timedelta 对象，包含了从发送请求到响应到达之间经过的时间量，可以用于测试响应速度。比如 r.elapsed.microseconds 表示响应到达需要多少微秒。
encoding	解码 r.text 的编码方式
headers	返回响应头，字典格式
history	返回包含请求历史的响应对象列表（url）
is_permanent_redirect	如果响应是永久重定向的 url，则返回 True，否则返回 False
is_redirect	如果响应被重定向，则返回 True，否则返回 False
iter_content()	迭代响应
iter_lines()	迭代响应的行
json()	返回结果的 JSON 对象 (结果需要以 JSON 格式编写的，否则会引发错误)
links	返回响应的解析头链接
next	返回重定向链中下一个请求的 PreparedRequest 对象
ok	检查 "status_code" 的值，如果小于400，则返回 True，如果不小于 400，则返回 False
raise_for_status()	如果发生错误，方法返回一个 HTTPError 对象
reason	响应状态的描述，比如 "Not Found" 或 "OK"
request	返回请求此响应的请求对象
status_code	返回 http 的状态码，比如 404 和 200（200 是 OK，404 是 Not Found）
text	返回响应的内容，unicode 类型数据
url	返回响应的 URL

简单获取网页源代码信息代码：

import requests as r url = "https://网址.com" response = requests.get(url).text print(response)

这样获取了一个网站的源代码信息

关注