HTTP：一次完整的HTTP服务过程-CSDN博客

本文链接：https://blog.csdn.net/2401_87197015/article/details/142345214

首先会搜索浏览器自身的DNS缓存（缓存时间比较短，大概只有1分钟，且只能容纳1000条缓存）
如果浏览器自身的缓存里面没有找到，那么浏览器会搜索系统自身的DNS缓存
如果还没有找到，那么尝试从 hosts文件里面去找
在前面三个过程都没获取到的情况下，就递归地去域名服务器去查找，具体过程如下

在这里插入图片描述

DNS优化两个方面：DNS缓存、DNS负载均衡

TCP连接建立（三次握手）

拿到域名对应的IP地址之后，User-Agent（一般指浏览器）会以一个随机端口（1024<端口<65535）向服务器的WEB程序（常用的有httpd，nginx）等的80端口。这个连接请求（原始的http请求经过TCP/IP 4层模型的层层封包）到达服务器端后（这中间有各种路由设备，局域网内除外），进入到网卡，然后是进入到内核的TCP/IP协议栈（用于识别连接请求，解封包，一层一层的剥开），还有可能要经过Netfilter防火墙（属于内核的模块）的过滤，最终达到WEB程序，最终建立了TCP/IP的连接。

发起HTTP请求(建立连接后)

HTTP请求报文由三部分组成：请求行，请求头、空行 / 请求正文

请求行 : 用于描述客户端的请求方式（GET/POST等），请求的资源名称(URL)以及使用的HTTP协议的版本号

请求头 : 用于描述客户端请求哪台主机及其端口，以及客户端的一些环境信息等

空行 : 空行就是\r\n (POST请求时候有)

请求正文 : 当使用POST等方法时，通常需要客户端向服务器传递数据。这些数据就储存在请求正文中（GET方式是保存在url地址后面，不会放到这里）

举例：

GET请求

下面是浏览器对 http://localhost:8081/test?name=XXG&age=23的GET 请求时发送给服务器的数据：

在这里插入图片描述

可以看出请求包含请求行和请求头两部分。其中请求行中包含 method（例如 GET、POST）、URI（通一资源标志符）和协议版本三部分，三个部分之间以空格分开。请求行和每个请求头各占一行，以换行符 CRLF（即 \r\n）分割。

POST请求

下面是浏览器对 http://localhost:8081/test 的 POST 请求时发送给服务器的数据，消息体中带上参数 name=XXG&age=23

在这里插入图片描述

可以看出，上面的请求包含三个部分：请求行、请求头、空格/消息体，比之前的 GET 请求多了一个请求消息，其中请求头和消息体之间用一个空行分割。POST 请求的参数不在 URL 中，而是在消息体中，请求头中多了一项 Content-Length 用于表示消息体的字节数，这样服务器才能知道请求是否发送结束。这也就是 GET 请求和 POST 请求的主要区别。

那么起始行中的请求方法有哪些种呢？

GET: 完整请求一个资源（常用）

HEAD: 仅请求响应首部

POST：提交表单（常用）

PUT: (webdav) 上传文件（但是浏览器不支持该方法）

DELETE：(webdav) 删除

OPTIONS：返回请求的资源所支持的方法的方法

TRACE: 追求一个资源请求中间所经过的代理（该方法不能由浏览器发出）

那什么是URL、URI、URN？

URI Uniform Resource Identifier 统一资源标识符

URL Uniform Resource Locator 统一资源定位符

URN Uniform Resource Name 统一资源名称

URL和URN 都属于 URI，为了方便就把URL和URI暂时都通指一个东西

服务器响应http请求，浏览器得到html代码

HTTP响应也由三部分组成：状态行，响应头，空格，消息体

状态行包括：协议版本、状态码、状态码描述

状态码 : 状态码用于表示服务器对请求的处理结果

1xx：指示信息——表示请求已经接受，继续处理

2xx：成功——表示请求已经被成功接收、理解、接受。

3xx：重定向——要完成请求必须进行更进一步的操作

4xx：客户端错误——请求有语法错误或请求无法实现

5xx：服务器端错误——服务器未能实现合法的请求。

列举几种常见的：

200（没有问题）

302（要你去找别人）

304（要你去拿缓存）

307（要你去拿缓存）

403（有这个资源，但是没有访问权限）

404（服务器没有这个资源）

500（服务器这边有问题）

响应头：响应头用于描述服务器的基本信息，以及客户端如何处理数据

空格：CRLF（即 \r\n）分割

消息体：服务器返回给客户端的数据

响应格式如下图

在这里插入图片描述

上面的 HTTP 响应中，响应头中的 Content-Length 同样用于表示消息体的字节数。Content-Type 表示消息体的类型，通常浏览网页其类型是HTML，当然还会有其他类型，比如图片、视频等。

浏览器解析html代码，并请求html代码中的资源

浏览器拿到html文件后，就开始解析其中的html代码，遇到js/css/image等静态资源时，就向服务器端去请求下载（会使用多线程下载，每个浏览器的线程数不一样），这是时候就用上 keep-alive特性了，建立一次HTTP连接，可以请求多个资源，下载资源的顺序就是按照代码里面的顺序，但是由于每个资源大小不一样，而浏览器又是多线程请求请求资源，所以这里显示的顺序并不一定是代码里面的顺序。