彻底理解浏览器的缓存机制

猫老板的豆

已于 2024-03-14 19:07:54 修改

阅读量4.1k

点赞数 10

分类专栏：面试必看浏览器文章标签：缓存前端协商缓存强制缓存

于 2023-08-30 17:57:26 首次发布

本文链接：https://blog.csdn.net/x550392236/article/details/132584609

版权

面试必看同时被 2 个专栏收录

52 篇文章 9 订阅

订阅专栏

浏览器

9 篇文章 0 订阅

订阅专栏

前言

在前端性能优化的方式中，最重要的当然是缓存了，使用好了缓存，对项目有很大的帮助。比如我们访问网页时，使用网页后退功能，会发现加载的非常快，体验感很好，这就是缓存的力量。

什么是缓存呢？
当我们第一次访问网站的时候，电脑会把网站上的图片和数据下载到电脑上，当我们再次访问该网站的时候，网站就会从电脑中直接加载出来，这就是缓存。

缓存的优点：

缓解服务器压力，不用每次都去请求某些数据了。(减载)
提升性能，打开本地资源肯定会比请求服务器来的快。(加速)
减少带宽消耗，当我们使用缓存时，只会产生很小的网络消耗,节约宽带(省钱)。

缓存的缺点：

占内存（有些缓存会被存到内存中）

所谓浏览器缓存其实就是指在本地使用的计算机中开辟一个内存区，同时也开辟一个硬盘区作为数据传输的缓冲区，然后用这个缓冲区来暂时保存用户以前访问过的信息。

浏览器的缓存机制也就是我们说的HTTP缓存机制，其机制是根据HTTP报文的缓存标识进行的。

缓存过程分析

浏览器与服务器通信的方式为应答模式，即是：浏览器发起HTTP请求 – 服务器响应该请求。

那么浏览器第一次向服务器发起该请求后拿到请求结果，会根据响应报文中HTTP头的缓存标识，决定是否缓存结果。
是：则将请求结果和缓存标识存入浏览器缓存中，简单的过程如下图：

在这里插入图片描述
由上图我们可以知道：

浏览器每次发起请求，都会先在浏览器缓存中查找该请求的结果以及缓存标识；
浏览器每次拿到返回的请求结果，都会将该结果和缓存标识存入·浏览器缓存中；

以上两点结论就是浏览器缓存机制的关键，他确保了每个请求的缓存存入与读取，只要我们再理解浏览器缓存的使用规则，那么所有的问题就迎刃而解了，本文也将围绕着这点进行详细分析。
为了方便大家理解，这里我们根据是否需要向服务器重新发起HTTP请求将缓存过程分为两个部分，分别是强制缓存和协商缓存。

强制缓存

强制缓存就是向浏览器缓存查找该请求结果，并根据该结果的缓存规则来决定是否使用该缓存结果的过程。

强制缓存的情况主要有以下三种：

不存在该缓存结果和缓存标识，强制缓存失效，则直接向服务器发起请求（跟第一次发起请求一致），如下图：
存在该缓存结果和缓存标识，但该结果已失效，强制缓存失效，则使用协商缓存(暂不分析)，如下图
存在该缓存结果和缓存标识，且该结果尚未失效，强制缓存生效，直接返回该结果，如下图

强制缓存的缓存规则是什么？

当浏览器向服务器发起请求时，服务器会将缓存规则放入HTTP响应报文的HTTP头中和请求结果一起返回给浏览器。

控制强制缓存的字段分别是Expires和Cache-Control，其中Cache-Control优先级比Expires高。

Expires

Expires是HTTP/1.0控制网页缓存的字段，其值为服务器返回该请求结果缓存的到期时间（GMT格式时间），即再次发起该请求时，如果客户端的时间小于Expires的值时，直接使用缓存结果。

到了HTTP/1.1，Expire已经被Cache-Control替代，原因在于Expires控制缓存的原理是使用客户端的时间与服务端返回的时间做对比，那么如果客户端与服务端的时间因为某些原因（例如时区不同；客户端和服务端有一方的时间不准确）发生误差，那么强制缓存则会直接失效，这样的话强制缓存的存在则毫无意义，那么Cache-Control又是如何控制的呢？

Cache-Control

在HTTP/1.1中，Cache-Control是最重要的规则，主要用于控制网页缓存，当Cache-Control都存在时，Cache-Control优先级更高，主要取值为：

public：共享缓存（代理级缓存） 共享缓存可以被多个用户使用，响应不是针对单个用户的
private：私有缓存（浏览器级缓存） 只能被单个用户缓存，通常是在用户的浏览器或用户代理中。它不能被共享缓存（如代理服务器或 CDN）所存储。通常用于那些包含用户特定信息或敏感数据的内容。通过将其标记为 Private，您可以确保这些内容不会被存储在可能被多个用户访问的共享缓存中，从而提高了隐私性和安全性。
no-cache：客户端缓存资源，但是是否使用缓存则需要经过协商缓存来验证决定，即不走强制缓存；
no-store：资源不会被缓存，即不使用强制缓存，也不使用协商缓存；
max-age=xxx (xxx is numeric)：缓存保质期，缓存内容将在xxx秒后失效；

示例：

接下来，我们直接看一个例子，如下：
在这里插入图片描述
由上面的例子我们可以知道：

HTTP响应报文中expires的时间值，是一个绝对值
HTTP响应报文中Cache-Control为max-age=600，是相对值

由于Cache-Control的优先级比expires，那么直接根据Cache-Control的值进行缓存，
意思就是说在600秒内再次发起该请求，则会直接使用缓存结果，强制缓存生效。

注：在无法确定客户端的时间是否与服务端的时间同步的情况下，Cache-Control相比于expires是更好的选择，所以同时存在时，只有Cache-Control生效。

缓存存放位置

在这里插入图片描述
上图状态码为灰色的请求则代表使用了强制缓存，请求对应的Size值则代表该缓存存放的位置，分别为 from memory cache 和 from disk cache。

from memory cache：
使用内存中的缓存；会将编译解析后的文件，直接存入该进程的内存中，占据该进程一定的内存资源，以方便下次运行使用时的快速读取。一旦该进程关闭，则该进程的内存则会清空。
from disk cache：
使用硬盘中的缓存；直接将缓存写入硬盘文件中，读取缓存需要对该缓存存放的硬盘文件进行I/O操作，然后重新解析该缓存内容，读取复杂，速度比内存缓存慢。

在浏览器中，浏览器会在js和图片等文件解析执行后直接存入内存缓存中，那么当刷新页面时只需直接从内存缓存中读取(from memory cache)；而css文件则会存入硬盘文件中，所以每次渲染页面都需要从硬盘读取缓存(from disk cache)。

协商缓存

协商缓存就是强制缓存失效后，浏览器携带缓存标识向服务器发起请求，由服务器根据缓存标识决定是否使用缓存的过程。

主要有以下两种情况：

协商缓存生效，返回304，如下
协商缓存失效，返回200和请求结果结果，如下

同样，协商缓存的标识也是在响应报文的HTTP头中和请求结果一起返回给浏览器的。
控制协商缓存的字段分别有：Last-Modified / If-Modified-Since和Etag / If-None-Match。
其中Etag / If-None-Match的优先级比Last-Modified / If-Modified-Since高。

Last-Modified / If-Modified-Since

Last-Modified

是服务器响应请求时，返回该资源文件在服务器最后被修改的时间（GMT格式时间），如下：
last-modify

If-Modified-Since

是客户端再次发起该请求时，携带上次请求返回的Last-Modified值，通过此字段值告诉服务器该资源上次请求返回的最后被修改时间。服务器收到该请求，发现请求头含有If-Modified-Since字段，则会根据If-Modified-Since的字段值与该资源在服务器的最后被修改时间做对比，若服务器的资源最后被修改时间大于If-Modified-Since的字段值，则重新返回资源，状态码为200；否则则返回304，代表资源无更新，可继续使用缓存文件，如下：

Etag / If-None-Match

Etag

是服务器响应请求时，返回当前资源文件的一个唯一标识(由服务器生成的一个hash值)，如下：
Etag

If-None-Match

是客户端再次发起该请求时，携带上次请求返回的唯一标识Etag值，通过此字段值告诉服务器该资源上次请求返回的唯一标识值。服务器收到该请求后，发现该请求头中含有If-None-Match，则会根据If-None-Match的字段值与该资源在服务器的Etag值做对比，一致则返回304，代表资源无更新，继续使用缓存文件；不一致则重新返回资源文件，状态码为200，如下：

注：Etag / If-None-Match优先级高于Last-Modified / If-Modified-Since，同时存在则只有Etag / If-None-Match生效。

总结

我们第一次进入页面，请求服务器，然后服务器进行应答，浏览器会根据response Header来判断是否对资源进行缓存，如果响应头中expires或者cache-control字段，代表这是强缓存，浏览器就会把资源缓存在memory cache 或 disk cache中。

第二次请求时，浏览器判断请求参数，如果符合强缓存条件就直接返回状态码200，从本地缓存中拿数据。
否则把响应参数存在request header请求头中，看是否符合协商缓存，符合则返回状态码304，不符合则服务器会返回全新资源。

强制缓存优先于协商缓存进行，若强制缓存(Expires和Cache-Control)生效则直接使用缓存，若不生效则进行协商缓存(Last-Modified / If-Modified-Since和Etag / If-None-Match)，协商缓存由服务器决定是否使用缓存，若协商缓存失效，那么代表该请求的缓存失效，重新获取请求结果，再存入浏览器缓存中；生效则返回304，继续使用缓存，主要过程如下：

在这里插入图片描述