详解HTTP协议

最新推荐文章于 2024-05-13 08:45:45 发布

测试迷你白

最新推荐文章于 2024-05-13 08:45:45 发布

阅读量481

点赞数

分类专栏： python接口自动化测试基础文章标签： HTTP 接口测试

本文链接：https://blog.csdn.net/weixin_43882774/article/details/92432448

版权

python接口自动化同时被 2 个专栏收录

13 篇文章 3 订阅

订阅专栏

测试基础

8 篇文章 1 订阅

订阅专栏

HTTP协议解读

**HTTP协议:**超文本传输协议（HyperText Transfer Protocol)是[互联网](https://baike.baidu.com/item/%E4%BA%92%E8%81%94%E7%BD%91)上应用最为广泛的一种[网络协议](https://baike.baidu.com/item/%E7%BD%91%E7%BB%9C%E5%8D%8F%E8%AE%AE/328636)。所有的HTML文件都必须遵守这个标准。设计HTTP最初的目的是为了提供一种发布和接收[HTML](https://baike.baidu.com/item/HTML)页面的方法。

**HTTPS协议**（Hypertext Transfer Protocol over Secure Socket Layer）简单讲是HTTP的安全版，在HTTP下加入SSL层。

`SSL`（Secure Sockets Layer 安全套接层）主要用于Web的安全传输协议，在传输层对网络连接进行加密，保障在Internet上数据传输的安全。

- `HTTP`的端口号为 80，
- `HTTPS`的端口号为 443

1、HTTP请求的过程：

HTTP通信由两部分组成： **客户端请求消息** 与 **服务器响应消息**

1. 当用户在浏览器的地址栏中输入一个URL并按回车键之后，浏览器会向HTTP服务器发送HTTP请求。HTTP请求主要分为“Get”和“Post”两种方法。
2. 当我们在浏览器输入URL <http://www.baidu.com> 的时候，浏览器发送一个Request请求去获取 <http://www.baidu.com> 的html文件，服务器把Response文件对象发送回给浏览器。
3. 浏览器分析Response中的 HTML，发现其中引用了很多其他文件，比如Images文件，CSS文件，JS文件。浏览器会自动再次发送Request去获取图片，CSS文件，或者JS文件。
4. 当所有的文件都下载成功后，网页会根据HTML语法结构，完整的显示出来了。

URL（Uniform / Universal Resource Locator的缩写）：统一资源定位符，是用于完整地描述Internet上网页和其他资源的地址的一种标识方法。

基本格式：

- scheme：协议(例如：http, https, ftp)
- host：服务器的IP地址或者域名
- port：服务器的端口（如果是走协议默认端口，缺省端口80）
- path：访问资源的路径
- query-string：参数，发送给http服务器的数据
- anchor：锚（跳转到网页的指定锚点位置）

2、HTTP请求信息

在浏览器中输入URL地址，访问某个网站，发送一个HTTP请求到服务器的请求消息，包括以下格式
请求行请求头部空行请求数据

- **1.Host (主机和端口号)**

Host：对应网址URL中的Web名称和端口号（域名）

- **2. Connection (链接类型)**

Connection：表示客户端与服务连接类型:keep-alive表示长连接（HTTP/1.1使用 keep-alive 为默认值。）

- **3. Upgrade-Insecure-Requests (升级为HTTPS请求)**

Upgrade-Insecure-Requests：升级不安全的请求，意思是会在加载 http 资源时自动替换成 https 请求，让浏览器不再显示https页面中的http请求警报。

- **4、User-Agent (浏览器名称)**

User-Agent：是客户浏览器的名称。

- **5、Accept (传输文件类型)**

Accept：指浏览器或其他客户端可以接受的文件类型，服务器可以根据它判断并返回适当的文件格式。

`Accept: text/html, application/xhtml+xml;q=0.9, image/*;q=0.8`：表示浏览器支持的 MIME 类型分别是 html文本、xhtml和xml文档、所有的图像格式资源。

- **Text：**文本信息，可以是多种字符集和或者多种格式的；
- **Application：**用于传输应用程序数据或者二进制数据。
- **q是权重系数，**范围 0 =< q <= 1，q 值越大，越靠前。默认为1，按从左到右排序顺序；若赋值为0，表示浏览器不接受此类型。

- **6. Referer (页面跳转处)**

Referer：表明产生请求的网页来自于哪个URL，用户是从该 Referer页面访问到当前请求的页面。这个属性可以用来跟踪Web请求来自哪个页面，是从什么网站来的等。

- **7. Accept-Encoding（文件编解码格式）**

Accept-Encoding：指出浏览器可以接受的编码方式。编码方式不同于文件格式，它是为了压缩文件并加速文件传递速度。浏览器在接收到Web响应之后先解码，然后再检查文件格式，许多情形下这可以减少大量的下载时间。

- **8. Accept-Language（语言种类）**

Accept-Langeuage：指出浏览器可以接受的语言种类，如en或en-us指英语，zh或者zh-cn指中文，当服务器能够提供一种以上的语言版本时要用到。

- **9、Cache-Control:max-age=0 明确表示不会缓存服务器资源**、

- **10、Accept-Charset（字符编码）**

Accept-Charset：指出浏览器可以接受的字符编码。

如果在请求消息中没有设置这个域，缺省是任何字符集都可以接受。

- **11. Cookie （Cookie）**

Cookie：浏览器用这个属性向服务器发送Cookie。Cookie是在浏览器中寄存的小型数据体，它可以记载和服务器相关的用户信息，也可以用来实现会话功能，以后会详细讲。

- **12. Content-Type (POST数据类型)**

Content-Type：POST请求里用来表示的内容类型

3、HTTP请求方法

根据HTTP标准，HTTP请求可以使用多种请求方法。

HTTP 0.9：只有基本的文本 GET 功能。

HTTP 1.0：完善的请求/响应模型，并将协议补充完整，定义了三种请求方法： GET, POST 和 HEAD方法。

HTTP 1.1：在 1.0 基础上进行更新，新增了五种请求方法：OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法。

HTTP 2.0（未普及）：请求/响应首部的定义基本没有改变，只是所有首部键必须全部小写，而且请求行要独立为 :method、:scheme、:host、:path这些键值对。
GET 请求指定的页面信息，并返回实体主体。
HEAD 类似于get请求，只不过返回的响应中没有具体的内容，用于获取报头
POST 向指定资源提交数据进行处理请求（例如提交表单或者上传文件），数据被包含在请求体中。POST请求可能会导致新的资源的建立和/或已有资源的修改。
PUT 从客户端向服务器传送的数据取代指定的文档的内容。
DELETE 请求服务器删除指定的页面。
CONNECT HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。
OPTIONS 允许客户端查看服务器的性能。
TRACE 回显服务器收到的请求，主要用于测试或诊断。

**HTTP请求常用的`Get`和`Post`两种方法**

- GET是从服务器上获取数据，POST是向服务器传送数据
- GET请求参数显示，都显示在浏览器网址上，HTTP服务器根据该请求所包含URL中的参数来产生响应内容，即“Get”请求的参数是URL的一部分。例如： `http://www.baidu.com/s?wd=Chinese`

- POST请求参数在请求体当中，消息长度没有限制而且以隐式的方式进行发送，通常用来向HTTP服务器提交量比较大的数据（比如请求中包含许多参数或者文件上传操作等），请求的参数包含在“Content-Type”消息头里，指明该消息体的媒体类型和编码。

4、HTTP响应信息

服务器接收到请求后，返回的HTTP响应也由四个部分组成，分别是：
状态行消息报头空行响应正文

*1，Cache-Control：must-revalidate, no-cache, private。**

这个值告诉客户端，服务端不希望客户端缓存资源，在下次请求资源时，必须要从新请求服务器，不能从缓存副本中获取资源。

- Cache-Control是响应头中很重要的信息，当客户端请求头中包含Cache-Control:max-age=0请求，明确表示不会缓存服务器资源时,Cache-Control作为作为回应信息，通常会返回no-cache，意思就是说，"那就不缓存呗"。
- 当客户端在请求头中没有包含Cache-Control时，服务端往往会定,不同的资源不同的缓存策略，比如说oschina在缓存图片资源的策略就是Cache-Control：max-age=86400,这个意思是，从当前时间开始，在86400秒的时间内，客户端可以直接从缓存副本中读取资源，而不需要向服务器请求。

**2. Connection：keep-alive**

这个字段作为回应客户端的Connection：keep-alive，告诉客户端服务器的tcp连接也是一个长连接，客户端可以继续使用这个tcp连接发送http请求。

**3. Content-Encoding:gzip**

告诉客户端，服务端发送的资源是采用gzip编码的，客户端看到这个信息后，应该采用gzip对资源进行解码。

**4. Content-Type：text/html;charset=UTF-8**

告诉客户端，资源文件的类型，还有字符编码，客户端通过utf-8对资源进行解码，然后对资源进行html解析。通常我们会看到有些网站是乱码的，往往就是服务器端没有返回正确的编码。

**5. Date：Sun, 21 Sep 2016 06:18:21 GMT**

这个是服务端发送资源时的服务器时间，GMT是格林尼治所在地的标准时间。http协议中发送的时间都是GMT的，这主要是解决在互联网上，不同时区在相互请求资源的时候，时间混乱问题。

**6. Expires:Sun, 1 Jan 2000 01:00:00 GMT**

这个响应头也是跟缓存有关的，告诉客户端在这个时间前，可以直接访问缓存副本，很显然这个值会存在问题，因为客户端和服务器的时间不一定会都是相同的，如果时间不同就会导致问题。所以这个响应头是没有Cache-Control：max-age=*这个响应头准确的，因为max-age=date中的date是个相对时间，不仅更好理解，也更准确。

**7. Pragma:no-cache**

这个含义与Cache-Control等同。

**8.Server：Tengine/1.4.6**

这个是服务器和相对应的版本，只是告诉客户端服务器的信息。

**9. Transfer-Encoding：chunked**

这个响应头告诉客户端，服务器发送的资源的方式是分块发送的。一般分块发送的资源都是服务器动态生成的，在发送时还不知道发送资源的大小，所以采用分块发送，每一块都是独立的，独立的块都能标示自己的长度，最后一块是0长度的，当客户端读到这个0长度的块时，就可以确定资源已经传输完了。

**10. Vary: Accept-Encoding**

告诉缓存服务器，缓存压缩文件和非压缩文件两个版本，现在这个字段用处并不大，因为现在的浏览器都是支持压缩的。

**11. Cookie**：通过在客户端记录的信息确定用户的身份。

**12. Session**：通过在服务器端记录的信息确定用户的身份。

测试迷你白

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
详解HTTP协议

HTTP协议解读**HTTP协议:**超文本传输协议（HyperText Transfer Protocol)是[互联网](https://baike.baidu.com/item/%E4%BA%92%E8%81%94%E7%BD%91)上应用最为广泛的一种[网络协议](https://baike.baidu.com/item/%E7%BD%91%E7%BB%9C%E5%8D%8F%E8%AE...
复制链接

扫一扫