Python爬虫基础讲解之请求与响应~

最新推荐文章于 2024-05-30 20:49:48 发布

「已注销」

最新推荐文章于 2024-05-30 20:49:48 发布

阅读量1.1k

点赞数

分类专栏： python python爬虫基础文章标签： python linux unix 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_62853513/article/details/123296907

版权

本文介绍了Python爬虫中HTTP请求的基础知识，包括URL组成、请求方法（GET与POST）、请求头和常用请求报头字段。此外，还讲解了HTTP响应报文的结构，如响应行、响应头及常见响应头字段的含义，帮助读者理解网络请求的交互过程。

摘要由CSDN通过智能技术生成

请求

1. 请求目标(URL)

URL又叫作统一资源定位符，是用于完整地描述Internet上网页和其他资源的地址的一种方法。类似于windows的文件路径。
在这里插入图片描述 网址的组成:

http://:这个是协议，也就是HTTP超文本传输协议，也就是网页在网上传输的协议。
mail:这个是服务器名，代表着是一个邮箱服务器，所以是mail。
163.com:这个是域名，是用来定位网站的独一无二的名字。
mail.163.com:这个是网站名，由服务器名+域名组成。
/:这个是根目录，也就是说，通过网站名找到服务器，然后在服务器存放网页的根目录。
index.html:这个是根目录下的网页。
http://mail.163.com/index.html:这个叫做URL，统一资源定位符，全球性地址，用于定位网上的资源。

2. 请求体(response)

就像打电话一样，HTTP到底和服务器说了什么，才能让服务器返回正确的消息的，其实客户端的请求告诉了服务器这些内容：请求行、请求头部、空行、请求数据
在这里插入图片描述

3. 请求方法(Method)

HTTP请求可以使用多种请求方法，但是爬虫最主要就两种方法：GET和POST方法。

get请求:一般情况下，只从服务器获取数据下来，并不会对服务器资源产生任何影响的时候会使用get请求。
post请求:向服务器发送数据（登录)、上传文件等，会对服务器资源产生影响的时候会使用 post请求。

以上是在网站开发中常用的两种方法。并且一般情况下都会遵循使用的原则。但是有的网站和服务器为了做反爬虫机制，也经常会不按常理出牌，有可能一个应该使用get方法的请求就一定要改成post请求，这个要视情况而定。

GET与POST方法的区别:

GET是从服务器上获取数据，POST是向服务器传送数据
GET请求参数都显示在浏览器网址上，即Get"请求的参数是URL的一部分。例如:
http://www.baidu.com/s?wd=Chinese
POST请求参数在请求体当中，消息长度没有限制而且以隐式的方

最低0.47元/天解锁文章

「已注销」

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫基础讲解之请求与响应~

请求1. 请求目标(URL)URL又叫作统一资源定位符，是用于完整地描述Internet上网页和其他资源的地址的一种方法。类似于windows的文件路径。网址的组成:http://:这个是协议，也就是HTTP超文本传输协议，也就是网页在网上传输的协议。mail:这个是服务器名，代表着是一个邮箱服务器，所以是mail。163.com:这个是域名，是用来定位网站的独一无二的名字。mail.163.com:这个是网站名，由服务器名+域名组成。/:这个是根目录，也就是说，通过网站名找到服务器，然后
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。