一次完整的http服务的过程

最新推荐文章于 2023-10-07 14:46:44 发布

Yabi0527

最新推荐文章于 2023-10-07 14:46:44 发布

阅读量167

点赞数

本文链接：https://blog.csdn.net/qq_42033590/article/details/108530821

版权

一次完整的http服务的过程

当我们在web浏览器的地址栏输入：www.baidu.com 具体发生了什么

1：对www.baidu.com这个网址进行DNS域名解析，得到对应的ip地址

url(www,baicu.com) =>ip(192.168.1.1)

2：根据这个ip，找到对应的服务器，发起tcp的三次握手。

3：建立tcp链接后发起http请求

tcp是比http更底层一个连接协议（ip是tcp下面一层）

4：服务器响应http请求，浏览器得到html代码

5：浏览器解析html代码，并请求代码中的资源（如js、css、图片等）（先得到html代码，才能去找这些资源）

6：浏览器对页面进行渲染呈现给用户

7：服务器关闭TCP链接

注：

1.DNS怎么找到域名的？

DNS域名解析采用的是递归查询的方式，过程是，先去找DNS缓存->缓存找不到就去找根域名服务器->根域名又会去找下一级，这样递归查找之后，找到了，给我们的web浏览器。

2：为什么HTTP协议要基于TCP来实现？ ip底层->tcp->http 上层

TCP是一个端到端的可靠的面相连接的协议，HTTP基于传输层TCP协议不用担心数据传输的各种问题（当发生错误时，会重传）

3：最后一步浏览器是如何对页面进行渲染的？

a)解析html文件构成DOM树

b)解析CSS文件构成渲染树

c)边解析，边渲染

d)js单线程运行，js有可能修改DOM结构，意味着js执行完成前，后续的所有资源的下载是没有必要的，所以js是单线程，会阻塞后续资源下载。

各个步骤具体细节

DNS解析（域名解析服务器）

a)首先会搜索浏览器自身的DNS缓存（缓存时间比较短，大概只有1分钟，且只能容纳1000条缓存）

b)如果浏览器自身的缓存里面没有找到，那么浏览器会搜索系统自身的DNS缓存

c)如果还没有找到，那么尝试从hosts文件里面去找

d)在前面三个过程都没获取到的情况下，就递归地去域名服务器去查找，具体过程如下

DNS优化有两个方面：DNS缓存，DNS负载均衡

TCP连接建立（三次握手）

拿到域名对应的ip地址后，User-Agent(一般指浏览器)会以一个随机端口（1024<端口<65535）向服务器的WEB程序（常用的有httpd,nginx）等的80端口。这个连接请求（原始的http请求经过TCP/IP 4层模型的层层封包）到达服务器端后（这中间有各种路由设备，局域网除外）进入到网卡，然后进入到内核的TCP/IP协议栈（用于识别连接请求，解封包，一层一层的剥开），还有可能要经过Netfilter防火墙（属于内核的模块）的过滤，最终达到WEB程序，最终建立了TCP/IP的链接。

发起HTTP请求（建立连接后）

HTTP请求报文由三部分组成：请求行，请求头，空行/请求正文

请求行：用于描述客户端的请求方式（GET/POST等），请求的资源名称（URL）以及使用的HTTP协议的版本号

请求头：用于描述客户端请求哪台主机及其端口，以及客户端的一些环境信息等

空行：空行就是\r\n（POST请求时候又）

请求正文：当使用POST等方法时，通常需要客户端向服务器传递数据。这些数据就储存在请求正文中（GET方式是保存在url地址后面，不会放到这里）

get请求包含请求行：方法、请求uri、协议版本号等请求头

post请求包含三个部分：请求行、请求头、空格/消息体，比之前的GET请求多了一个请求消息，其中请求头和消息体之间用一个空行分割。POST请求的参数不在URL中，而是在消息体中，请求头中多了一项Content-Length 用于表示消息体的字节数，这样服务器才能知道请求是否发送结束。这也是GET请求和POST请求的主要区别。

那么起始行中的请求方法有哪些种呢？

GET ：完整请求一个资源（常用）

HEAD：仅请求响应首部

POST：提交表单（常用）

PUT:（webdav）上传文件（但浏览器不支持该方法）

DELETE:（webdav）删除

OPTIONS：返回请求的资源所支持的方法的方法

TRACE：追求一个资源请求中间多经过的代理（该方法不能由浏览器发出）

什么是URL,URI,URN?

URI Uniform Reasource Identifier 统一资源标识符

URL Uniform Reasource Locator 统一资源定位符

URN Uniform Reasource Name 统一资源名称

URL和URN都属于URI ，为了方便就把URI和URL暂时都通指一个东西

服务器响应http请求，浏览器得到html代码

HTTP响应也由三部分组成：状态行，响应头，空格，消息体

状态行包括：协议版本、状态码、状态码描述

状态码：状态码用于表示服务器对请求的处理结果

1xx:指示信息---表示请求已经接受，继续处理

2xx:成功--表示请求已经被成功接收、理解、接受

3xx:重定向--要完成请求必须进行再进一步操作

4xx：客户端错误--请求有语法错误或请求无法实现

5xx:服务端错误--服务器未能实现合法的请求

https://zh.wikipedia.org/wiki/HTTP%E7%8A%B6%E6%80%81%E7%A0%81 维基百科状态码大全

说出200 302要你去找别人 304要你去拿缓存 307要你去拿缓存 403有这个资源，但没有访问权限 404服务器没有这个资源 500服务器这边有问题

响应头：响应头用于描述服务器的基本信息，以及客户端如何处理数据

空格：crlf分割

消息体：服务器返回给客户端的数据

响应头中的Content-Length同样用于表示消息体的字节数。Content-Type表示消息体的类型，通常浏览网页其类型是HTML，当然还会有其他类型，比如图片、视频等。

浏览器解析html代码，并请求html代码中的资源

浏览器拿到html文件后，就开始解析其中的html代码，遇到js/css/image等静态资源时，就向服务器端去请求下载（会使用多线程下载，每个浏览器的线程数不一样，）这是时候就用上keep-alive特性，建立一次HTTP连接，可以请求多个资源，下载资源的顺序就是按照代码里面的顺序，但是由于每个资源大小不一样，而浏览器又是多线程请求资源，所以这里显示的顺序，并不一定是代码里面的顺序。

浏览器对页面进行渲染呈现给用户

最后，浏览器利用自己内部的工作机制，把请求的静态资源和html代码进行渲染，渲染之后呈现给客户，浏览器是一个边解析边渲染的过程。

首先浏览器解析HTML文件构建DOM树，然后解析CSS文件构建渲染树，等到渲染树构建完成后，浏览器开始布局渲染树并将其绘制到屏幕上。

这个过程比较复杂，涉及到两个概念：reflow(回流)和（repain）重绘

DOM节点中的各个元素都是以盒模型的形式存在，这些都需要浏览器去计算其位置和大小等，这个过程称为relow;当盒模型的位置，大小以及其他属性，如颜色，字体，等确定下来之后，浏览器便开始绘制内容，这个过程称为repain.

页面在首次加载时必然会经理reflow和repain

js的解析是由浏览器中的JS解析引擎完成的。

JS是单线程运行，JS有可能修改DOM结构，意味着JS执行完成前，后续所有资源的下载是没有必要的，所以JS单线程，会阻塞后续资源下载。

服务器关闭TCP链接

一般情况下，一旦web服务器向浏览器发送了请求数据，它就要关闭TCP链接，然后如果浏览器或者服务器在其头加入了这行代码：

Connextion:keep-alive

TCP链接在发送后将仍然保持打开状态，于是，浏览器可以继续通过相同的连接发送请求。保持链接节省了为每个请求建立新链接所需的时间，还节约了网络带宽。

自此一次完成的HTTP事务宣告完成。

三个考察点

1：地址输入url开始，域名到ip的过程

2：拿到ip，开始建立http请求

3：拿到html之后的浏览器的渲染过程

Yabi0527

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
一次完整的http服务的过程

一次完整的http服务的过程当我们在web浏览器的地址栏输入：www.baidu.com 具体发生了什么1：对www.baidu.com这个网址进行DNS域名解析，得到对应的ip地址url(www,baicu.com) =>ip(192.168.1.1)2：根据这个ip，找到对应的服务器，发起tcp的三次握手。3：建立tcp链接后发起http请求tcp是比http更底层一个连接协议（ip是tcp下面一层）4：服务器响应http请求，浏览器得到html代码5：浏览器解析
复制链接

扫一扫