Python爬虫学习（一）Requests库入门

最新推荐文章于 2024-08-10 23:14:03 发布

浩然丶

最新推荐文章于 2024-08-10 23:14:03 发布

阅读量205

点赞数 2

分类专栏： Python-爬虫文章标签： python http

本文链接：https://blog.csdn.net/qq_39419113/article/details/105489591

版权

本文是Python爬虫系列的第一篇，重点介绍了Requests库的基础知识，包括HTTP协议的理解，Requests库的7种核心方法，以及如何通过status_code检查网页请求状态。通过学习，你可以掌握爬取网页的基本步骤。

摘要由CSDN通过智能技术生成

（一）Requests库入门

(1)HTTP协议

#HTTP 超文本传输协议
#HTTP是一种基于“请求与响应”模式的、无状态的应用层协议
#HTTP采用URL作为定位网络资源的标识，一个URL对应一个数据资源
-------------------------------
http：//host[:post][path]
host:合法的Internet主机域名或IP地址
port：端口号，缺省为80
path：请求资源的路径
-------------------------------

方法	作用
GET	请求获取URL位置的资源
HEAD	请求获取URL位置资源的响应消息报告（头部信息）
POST	请求向URL位置的资源后附加新的数据
PUT	请求向URL位置存储一个资源，覆盖原URL位置的资源（更新全覆盖）
PATCH	请求局部更新URL位置的资源，即改变该处资源的部分内容（局部覆盖更新）
DELETE	请求删除URL位置存储的资源

(2)Requests库的7种主要方法

方法	作用
requests.request(method, url, **kwargs)	构造一个请求，支撑以下各方法的基础方法
requests.get()	获取HTML网页的主要方法，对应于HTTP的GET
requests.head()	获取HTML网页头信息的方法，对应于HTTP的HEAD
requests.post()	向HTML网页提交POST请求的方法，对应于HTTP的POST
requests.put()	向HTML网页提交PUT请求的方法，对应于HTTP的PUT
requests.patch()	向HTTP网页提交局部修改请求，对应于HTTP的PATCH
requests.

最低0.47元/天解锁文章

浩然丶

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
Python爬虫学习（一）Requests库入门

（一）Requests库入门(1)HTTP协议#HTTP 超文本传输协议#HTTP是一种基于“请求与响应”模式的、无状态的应用层协议#HTTP采用URL作为定位网络资源的标识，一个URL对应一个数据资源-------------------------------http：//host[:post][path]host:合法的Internet主机域名或IP地址port：端口号，缺省...
复制链接

扫一扫