HTTP相关面试题整理

懒虫虫~

于 2021-01-09 09:29:43 发布

阅读量547

点赞数

分类专栏：通讯协议文章标签： http java

本文链接：https://blog.csdn.net/jike11231/article/details/112387487

版权

通讯协议专栏收录该内容

4 篇文章 0 订阅

订阅专栏

一、HTTP协议

在 OSI 七层模型中，HTTP协议位于最顶层的应用层中。通过浏览器访问网页就直接使用了 HTTP 协议。使用 HTTP 协议时，客户端首先与服务端的 80 端口建立一个 TCP 连接，然后在这个连接的基础上进行请求和应答，以及数据的交换。

HTTP 有两个常用版本，分别是 1.0 和 1.1。
主要区别在于 HTTP 1.0 中每次请求和应答都会使用一个新的 TCP 连接，而从 HTTP 1.1 开始，运行在一个 TCP 连接上发送多个命令和应答。因此大幅度减少了 TCP 连接的建立和断开，提高了效率。

HTTP的缺点
通信使用明文不加密，内容可能被窃听
不验证通信方身份，可能遭到伪装
无法验证报文完整性，可能被篡改

HTTP1.1版本新特性
默认持久连接节省通信量，只要客户端服务端任意一端没有明确提出断 - 管线化，客户端可以同时发出多个HTTP请求，而不用一个个等待响应

断点续传（实际上就是利用HTTP消息头使用分块传输编码，将实体主体分块传输）

二、常用的HTTP方法有哪些？

GET：用于请求访问已经被URL（统一资源标识符）识别的资源，可以通过URL传参给服务器。
POST：用于传输信息给服务器，主要功能与Get方法类似，但一般推荐POST方式。
PUT：传输文件，报文主体包含文件内容，保存到对应URL位置。
HEAD：获取报文首部，与GET方法类似，只是不返回报文主体，一般用于验证URL是否有效。
DELET：删除文件，与PUT方法相反，删除对应URL位置的文件。
OPTIONS：查询相应URL支持的HTTP方法。

三、游览器输入一个地址。到页面展示中间经历了哪些东西？

3.1经历步骤

1、游览器输入url。先解析url地址是否合法
2、游览器检查是否有缓存（游览器缓存-系统缓存-路由器缓存）。如果有，直接显示。如果没有，跳到第三步。
3、在发送http请求前，需要域名解析（DNS解析），解析获取对应过的ip地址。
4、游览器向服务器发起tcp链接，与游览器建立tcp三次握手
5、握手成功后，游览器向服务器发送http请求，请求数据包
6、服务器收到处理的请求，将数据返回至游览器
7、游览器收到http响应。
8、游览器解析响应。如果响应可以缓存，则存入缓存
9、游览器发送请求获取嵌入在HTML中的资源（html，css，JavaScript，图片，音乐等），对于未知类型，会弹出对话框
10、游览器发送异步请求
11、页面全部渲染结束。

3.2 浏览器渲染html的过程

渲染步骤
　　浏览器在接收到html文件后，会分几个步骤html文件转化成界面，这个过程就是渲染。

1、解析html
　　2、构建dom树
　　3、dom树结合css文件，构建呈现树
　　4、布局
　　5、绘制

先整体描述一下我的理解：
1、解析html和构建dom树是同步进行的，这个过程就是逐行解析代码，包括html标签和js动态生成的标签，最终生成dom树。

2、构建呈现树，就是把css文件和style标签的中的内容，结合dom树的模型，构建一个呈现树，写到内存，等待进一步生成界面。呈现树一定依赖dom树，呈现节点一定会有对应的dom节点，但是dom节点不一定会有对应的呈现节点，比如，被隐藏的一个div。

3、布局，这一步就是结合呈现树，把dom节点的大小、位置计算出来。虽然呈现节点已经附着在都没节点上，会有对元素大小、位置的定义，但是浏览器还需要根据实际窗口大小进行计算，比如对auto的处理。

4、绘制，把css中有关颜色的设置，背景、字体颜色等呈现出来。

3.3 html解析和dom树构建

关于渲染的过程，dom树的构建对与一些后端人员还是比较重要的，它关系到js代码能否正确的被执行。

html的解析，遵循以下规则：

1、按顺序解析。
html的代码，是从上到下一行行执行的，也就是说如果js代码写在head头里，且没有用加在 $() . r e a d y (f u n c t i o n) 方法里，那么他是无法读取到 b o d y 里的标签的。之所以加在$ ().ready(function)里可以执行，是因为，$().ready(function)里的函数会在dom树加载之后执行，当然执行之久dom可能还会改变。

2、link标签的加载，阻塞后续代码执行，但不阻塞后续外部文件（link、script）加载。

html的代码是按顺序解析，那么在遇到link标签后，会在link加载（从服务器下载）完毕后，再执行后续代码。但与此同时，如何还有外部文件，则是同时加载。但是外部文件内的代码不会执行，只会在代码解析到它的时候执行。

3、添加async属性的script。
添加async属性之后，script加载的外部文件成为了异步加载，这时相当于它于原本的html解析过程同步进行。所以他不会被任何加载过程阻塞，只会在自己加载完成之后执行。但是，异步执行的影响就是，它如要读取dom节点，很可能会失败，因为它的加载和html解析过程没有了先后顺序。另外，如果它要输出动态的dom节点，就无法保证节点的位置，因为它添加的节点，是在html已解析的节点下顺序添加的。

 <script src="http://udacity-crp.herokuapp.com/time.js?rtt=1&a" async></script>

4、对于动态创建的link标签不会阻塞其后动态创建的script标签的加载和执行，但是其后非动态创建的script扔按1、2、3条的规则执行。

四、GET和POST的区别：

简单来说：GET产生一个TCP数据包，POST产生两个TCP数据包
严格的说：对于GET方式的请求，游览器会把http header和data一并发送出去，服务器响应200（返回数据）；
而对于POST请求。游览器先发送header，服务器响应100 continue，游览器再发送data，服务器响应200 ok（返回数据）

1、get是从服务器上获取数据，post是向服务器传送数据。

2、get是把参数数据队列加到提交表单的ACTION属性所指的URL中，值和表单内各个字段一一对应，在URL中可以看到。
post是通过HTTP 的post机制，将表单内各个字段与其内容放置在HTML header内一起传送到ACTION属性所指的URL地址。用户看不到这个过程。

3、对于get方式，服务器端用Request.QueryString获取变量的值，对于post方式，服务器端用Request.Form获取提交的数据。

4、get传送的数据量较小，因为受URL限制，不能大于2KB，但是效率高。
post传送的数据量较大，一般被默认为不受限制，所以上传文件时只能用post。但理论上，IIS4中最大量为80KB，IIS5中为100KB。

5、get安全性非常低，因为URL是可见的，可能会泄露私密信息，如密码等，post安全性较高。但是执行效率却比Post方法好。

6、get方式只能支持ASCII字符，向服务器传的中文字符可能会乱码。
post支持标准字符集，可以正确传递中文字符。

7、get请求可以被缓存，可以被收藏为书签，但 post 不行。
get请求会保留在浏览器的历史记录中，post 不会。

SO：
1、Get方式的安全性较Post方式要差些，包含机密信息的话，建议用Post数据提交方式；
2、在做数据查询时，建议用Get方式；而在做数据添加、修改或删除时，建议用Post方式

注意：
1、POST 请求仅比 GET 请求略安全一点，它的数据不在 URL 中，但依然以明文的形式存放于 HTTP 的请求头中。
2、据研究，在网络环境好的情况下，发一次包的时间和发两次包的时间差别基本可以无视。而在网络环境差的情况下，两次包的TCP在验证数据包完整性上，有非常大的优点。
3、并不是所有浏览器都会在POST中发送两次包，Firefox就只发送一次。

五、HTTP请求报文与响应报文格式

请求报文包含三部分：
请求行：包含请求方法、URI、HTTP版本信息
请求首部字段
请求内容实体

响应报文包含三部分：
状态行：包含HTTP版本、状态码、状态码的原因短语
响应首部字段
响应内容实体

六、常见的HTTP相应状态码

常见的HTTP相应状态码
200：请求被正常处理
204：请求被受理但没有资源可以返回
206：客户端只是请求资源的一部分，服务器只对请求的部分资源执行GET方法，相应报文中通过Content-Range指定范围的资源。
301：永久性重定向
302：临时重定向
303：与302状态码有相似功能，只是它希望客户端在请求一个URI的时候，能通过GET方法重定向到另一个URI上
304：发送附带条件的请求时，条件不满足时返回，与重定向无关
307：临时重定向，与302类似，只是强制要求使用POST方法
400：请求报文语法有误，服务器无法识别
401：请求需要认证
403：请求的对应资源禁止被访问
404：服务器无法找到对应资源
500：服务器内部错误
503：服务器正忙

七、常见HTTP首部字段

通用首部字段（请求报文与响应报文都会使用的首部字段）
Date：创建报文时间
Connection：连接的管理
Cache-Control：缓存的控制
Transfer-Encoding：报文主体的传输编码方式

请求首部字段（请求报文会使用的首部字段）
Host：请求资源所在服务器
Accept：可处理的媒体类型
Accept-Charset：可接收的字符集
Accept-Encoding：可接受的内容编码
Accept-Language：可接受的自然语言

响应首部字段（响应报文会使用的首部字段）
Accept-Ranges：可接受的字节范围
Location：令客户端重新定向到的URI
Server：HTTP服务器的安装信息

实体首部字段（请求报文与响应报文的的实体部分使用的首部字段）
Allow：资源可支持的HTTP方法
Content-Type：实体主类的类型
Content-Encoding：实体主体适用的编码方式
Content-Language：实体主体的自然语言
Content-Length：实体主体的的字节数
Content-Range：实体主体的位置范围，一般用于发出部分请求时使用

八、一次完整的HTTP请求事务

建立起客户机和服务器连接。
建立连接后，客户机发送一个请求给服务器。
服务器收到请求给予响应信息。
客户端浏览器将返回的内容解析并呈现，断开连接。

一次完整的HTTP请求所经历的7个步骤
HTTP通信机制是在一次完整的HTTP通信过程中，Web浏览器与Web服务器之间将完成下列7个步骤：

建立TCP连接->发送请求行->发送请求头->（到达服务器）发送状态行->发送响应头->发送响应数据->断TCP连接

具体步骤如下：
1、建立TCP连接
在HTTP工作开始之前，Web浏览器首先要通过网络与Web服务器建立连接，该连接是通过TCP来完成的，该协议与IP协议共同构建 Internet，即著名的TCP/IP协议族，因此Internet又被称作是TCP/IP网络。HTTP是比TCP更高层次的应用层协议，根据规则，只有低层协议建立之后才能，才能进行更层协议的连接，因此，首先要建立TCP连接，一般TCP连接的端口号是80。

2、Web浏览器向Web服务器发送请求行
一旦建立了TCP连接，Web浏览器就会向Web服务器发送请求命令。例如：GET /sample/hello.jsp HTTP/1.1。

3、Web浏览器发送请求头
浏览器发送其请求命令之后，还要以头信息的形式向Web服务器发送一些别的信息，之后浏览器发送了一空白行来通知服务器，它已经结束了该头信息的发送。

4、Web服务器应答
客户机向服务器发出请求后，服务器会客户机回送应答， HTTP/1.1 200 OK ，应答的第一部分是协议的版本号和应答状态码。

5、Web服务器发送应答头
正如客户端会随同请求发送关于自身的信息一样，服务器也会随同应答向用户发送关于它自己的数据及被请求的文档。

6、Web服务器向浏览器发送数据
Web服务器向浏览器发送头信息后，它会发送一个空白行来表示头信息的发送到此为结束，接着，它就以Content-Type应答头信息所描述的格式发送用户所请求的实际数据。

7、Web服务器关闭TCP连接
一般情况下，一旦Web服务器向浏览器发送了请求数据，它就要关闭TCP连接，然后如果浏览器或者服务器在其头信息加入了这行代码：
Connection:keep-alive

TCP连接在发送后将仍然保持打开状态，于是，浏览器可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间，还节约了网络带宽。

九、HTTP优化

主要是http2.0相关优化
TCP复用：TCP连接复用是将多个客户端的HTTP请求复用到一个服务器端TCP连接上，而HTTP复用则是一个客户端的多个HTTP请求通过一个TCP连接进行处理。前者是负载均衡设备的独特功能；而后者是HTTP 1.1协议所支持的新功能，目前被大多数浏览器所支持。

内容缓存：将经常用到的内容进行缓存起来，那么客户端就可以直接在内存中获取相应的数据了。

压缩：将文本数据进行压缩，减少带宽

SSL加密（SSL Acceleration）：使用SSL协议对HTTP协议进行加密，在通道内加密并加速

TCP缓冲：通过采用TCP缓冲技术，可以提高服务器端响应时间和处理效率，减少由于通信链路问题给服务器造成的连接负担。

十、什么是http协议无状态协议？怎么解决http协议无状态协议？

1、无状态协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息
2、无状态协议解决方法：通过cookie或session会话保存

十一、Cookie和Session的区别

HTTP 是一种无状态的连接，客户端每次读取 web页面时，服务器都会认为这是一次新的会话。但有时候我们又需要持久保持某些信息，比如登录时的用户名、密码，用户上一次连接时的信息等。这些信息就由 Cookie 和 Session 保存。

1、Cookie
cookie实际上是一小段文本信息。客户端请求服务器，如果服务器需要记录该用户状态，就使用response向客户端浏览器颁发一个cookie，客户端浏览器会把cookie保存起来，当浏览器再次请求访问该网站时，浏览器把请求的网站连同该cookie一同提交给服务器，服务器检查该cookie，以此来辨认用户状态。

简单来说，cookie的工作原理可总结如下：client连接server
client生成cookie（有效期）,再次访问时携带cookie
server根据cookie的信息识别用户身份

2、Session
Session是服务器端使用的一种记录客户端状态的机制，使用上比Cookie简单一些。同一个客户端每次和服务端交互时，不需要每次都传回所有的 Cookie 值，而是只要传回一个 ID，这个 ID 是客户端第一次访问服务器的时候生成的，而且每个客户端是唯一的。这样每个客户端就有了一个唯一的 ID，客户端只要传回这个 ID 就行了，这个 ID 通常是 name为 JSESIONID 的一个 Cookie。Session依据这个id来识别是否为同一用户（只认ID不认人）。
在这里插入图片描述
区别：
cookie数据存放在客户的浏览器上，session数据放在服务器上。
cookie不是很安全，别人可以分析存放在本地的COOKIE并进行COOKIE欺骗
考虑到安全应当使用session。
session会在一定时间内保存在服务器上。当访问增多，会比较占用你服务器的性能
考虑到减轻服务器性能方面，应当使用COOKIE。
单个cookie保存的数据不能超过4K，很多浏览器都限制一个站点最多保存20个cookie。

十二、http与https有什么区别？

1、https协议需要ca申请认证书，一般免费的较少

2、http是超文本传输协议，信息是明文传输，https则是具有安全性的ssl加密传输协议

3、http和https使用的是完全不同的连接方式，用的端口也不一样，http是80，https是443

4、http的连接很简单，是无状态的，https协议是由ssl+http协议构建的可进行加密传输，身份认证的网络协议，比http安全

参考资料
https://www.cnblogs.com/cbslock/p/10139160.html
https://www.cnblogs.com/6J2B2/p/12980363.html
https://blog.csdn.net/guorui_java/article/details/112294323

懒虫虫~

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
HTTP相关面试题整理

一、HTTP协议在 OSI 七层模型中，HTTP协议位于最顶层的应用层中。通过浏览器访问网页就直接使用了 HTTP 协议。使用 HTTP 协议时，客户端首先与服务端的 80 端口建立一个 TCP 连接，然后在这个连接的基础上进行请求和应答，以及数据的交换。HTTP 有两个常用版本，分别是 1.0 和 1.1。主要区别在于 HTTP 1.0 中每次请求和应答都会使用一个新的 TCP 连接，而从 HTTP 1.1 开始，运行在一个 TCP 连接上发送多个命令和应答。因此大幅度减少了 TCP 连接的建立和断
复制链接

扫一扫

专栏目录