Vite: 代码分割与拆包

最新推荐文章于 2025-03-25 10:01:43 发布

Wang's Blog

最新推荐文章于 2025-03-25 10:01:43 发布

阅读量7k

点赞数 33

分类专栏： FE Architecture 文章标签：前端 Vite

本文链接：https://blog.csdn.net/Tyro_java/article/details/140050644

版权

FE Architecture 专栏收录该内容

84 篇文章

订阅专栏

概述

在生产环境下，为了提高页面加载性能，构建工具一般将项目的代码打包(bundle)到一
起，这样上线之后只需要请求少量的 JS 文件，大大减少 HTTP 请求。当然，Vite 也不例
外，默认情况下 Vite 利用底层打包引擎 Rollup 来完成项目的模块打包。
某种意义上来说，对线上环境进行项目打包是一个必须的操作。但随着前端工程的日渐复
杂，单份的打包产物体积越来越庞大，会出现一系列应用加载性能问题，而代码分割可以
很好地解决它们。
我们看下 Code Splitting 解决了单产物打包模式下的哪些问题，然后用具体的项目示例体验一下 Vite 默认自带的 CodeSplitting 效果。
从中，你将了解到 Vite 的默认分包策略，以及底层所使用的 Rollup 拆包 API—— munaulChunks
当然，在实际的项目场景中，只用 Vite 默认的策略是不够的，我们会更深入一步，学习Rollup 底层拆包的各种高级姿势，实现自定义拆包，同时我也会带大家通过实际案例复现 Rollup 自定义拆包经常遇到的坑—— 循环引用问题，分析问题出现的原因
需要注意的是，bundle 、 chunk 、 vendor 这些构建领域的专业概念
- bundle 指的是整体的打包产物，包含 JS 和各种静态资源
- chunk 指的是打包后的 JS 文件，是 bundle 的子集
- vendor 是指第三方包的打包产物，是一种特殊的 chunk

Code Splitting 解决的问题

在传统的单 chunk 打包模式下，当项目代码越来越庞大，最后会导致浏览器下载一个巨
大的文件，从页面加载性能的角度来说，主要会导致两个问题:
- 无法做到按需加载，即使是当前页面不需要的代码也会进行加载
- 线上缓存复用率极低，改动一行代码即可导致整个 bundle 产物缓存失效
首先说第一个问题，一般而言，一个前端页面中的 JS 代码可以分为两个部分: Initital Chunk 和 Async Chunk ，前者指页面首屏所需要的 JS 代码，而后者当前页面并不一定需要，一个典型的例子就是路由组件，与当前路由无关的组件并不用加载。
而项目被打包成单 bundle 之后，无论是 Initial Chunk 还是 Async Chunk ，都会打包进同一个产物，也就是说，浏览器加载产物代码的时候，会将两者一起加载，导致许多冗余的加载过程，从而影响页面性能。而通过 Code Splitting 我们可以将按需加载的代码拆分出单独的chunk，这样应用在首屏加载时只需要加载 Initial Chunk 即可，避免了冗余的加载过
程，使页面性能得到提升。
其次，线上的缓存命中率是一个重要的性能衡量标准。对于线上站点而言，服务端一般在
响应资源时加上一些 HTTP 响应头，最常见的响应头之一就是 cache-control ，它可以指
定浏览器的强缓存，比如设置为下面这样:
- cache-control: max-age=31536000
表示资源过期时间为一年，在过期之前，访问相同的资源 url，浏览器直接利用本地的缓
存，并不用给服务端发请求，这就大大降低了页面加载的网络开销。不过，在单 chunk 打包模式下面，一旦有一行代码变动，整个 chunk 的 url 地址都会变化，比如下图所示的场景

由于构建工具一般会根据产物的内容生成哈希值，一旦内容变化就会导致整个 chunk 产物的强缓存失效，所以单 chunk 打包模式下的缓存命中率极低，基本为零。
而进行 Code Splitting 之后，代码的改动只会影响部分的 chunk 哈希改动，如下图所示

入口文件引用了 A 、 B 、 C 、 D 四个组件，当我们修改 A 的代码后，变动的 Chunk 就只有 A 以及依赖 A 的 Chunk 中，A 对应的 chunk 会变动，这很好理解，后者也会变动是因为相应的引入语句会变化，如这里的入口文件会发生如下内容变动:
```
import CompA from './A.d3e2f17a.js'
// 更新 import 语句
import CompA from './A.a5d2f82b.js'
```
也就是说，在改动 A 的代码后， B 、 C 、 D 的 chunk 产物 url 并没有发生变化，从而可以让浏览器复用本地的强缓存，大大提升线上应用的加载性能

Vite 默认拆包策略

刚刚我们说到了为什么要进行拆包，实际上 Vite 中已经内置了一份拆包的策略，接下来让我们来看看 Vite 默认的拆包模式是怎样的。
在生产环境下 Vite 完全利用 Rollup 进行构建，因此拆包也是基于 Rollup 来完成的，但Rollup 本身是一个专注 JS 库打包的工具，对应用构建的能力还尚为欠缺，Vite 正好是补足了 Rollup 应用构建的能力，在拆包能力这一块的扩展就是很好的体现。
Vite 2.9 之前的版本, 在初始化一个项目后，执行 $ npm run build，接着终端会出现如下的构建信息:

下产物的结构

.
├── assets
│ ├── Dynamic.3df51f7a.js // Async Chunk
│ ├── Dynamic.f2cbf023.css // Async Chunk (CSS)
│ ├── favicon.17e50649.svg // 静态资源
│ ├── index.1e236845.css // Initial Chunk (CSS)
│ ├── index.6773c114.js // Initial Chunk
│ └── vendor.ab4b9e1f.js // 第三方包产物 Chunk
└── index.html // 入口 HTML

一方面 Vite 实现了自动 CSS 代码分割的能力，即实现一个 chunk 对应一个 css 文件，比如上面产物中 index.js 对应一份 index.css ，而按需加载的 chunk Danamic.js 也对应单独的一份 Danamic.css 文件，与 JS 文件的代码分割同理，这样做也能提升 CSS 文件的缓存复用率。
而另一方面， Vite 基于 Rollup 的 manualChunks API 实现了应用拆包的策略:
- 对于 Initital Chunk 而言，业务代码和第三方包代码分别打包为单独的 chunk，在上述的例子中分别对应 index.js 和 vendor.js 。需要说明的是，这是 Vite 2.9 版本之前的做法，而在 Vite 2.9 及以后的版本，默认打包策略更加简单粗暴，将所有的 js代码全部打包到 index.js 中
- 对于 Async Chunk 而言，动态 import 的代码会被拆分成单独的 chunk，如上述的 Dynacmic 组件
小结一下，Vite 默认拆包的优势在于实现了 CSS 代码分割与业务代码、第三方库代码、动态 import 模块代码三者的分离，但缺点也比较直观，第三方库的打包产物容易变得比较臃肿，上述例子中的 vendor.js 的大小已经达到 500 KB 以上，显然是有进一步拆包的优化空间的，这个时候我们就需要用到 Rollup 中的拆包 API —— manualChunks 了。

自定义拆包策略

针对更细粒度的拆包，Vite 的底层打包引擎 Rollup 提供了 manualChunks ，让我们能自定义拆包策略，它属于 Vite 配置的一部分，示例如下:

// vite.config.ts
export default {
	 build: {
		 rollupOptions: {
			 output: {
				 // manualChunks 配置
				 manualChunks: {},
			 },
		 }
	  },
}

manualChunks 主要有两种配置的形式，可以配置为一个对象或者一个函数。我们先来看看对象的配置，也是最简单的配置方式，你可以在上述的示例项目中添加如下的 manualChunks 配置代码

// vite.config.ts
{
  build: {
    rollupOptions: {
      output: {
        // manualChunks 配置
        manualChunks: {
          // 将 React 相关库打包成单独的 chunk 中
          'react-vendor': ['react', 'react-dom'],
          // 将 Lodash 库的代码单独打包
          'lodash': ['lodash-es'],
          // 将组件库的代码打包
          'library': ['antd', '@arco-design/web-react'],
        },
      },
    }
  },
}

在对象格式的配置中， key 代表 chunk 的名称， value 为一个字符串数组，每一项为第三方包的包名。
在进行了如上的配置之后，我们可以执行 npm run build 尝试一下打包:
你可以看到原来的 vendor 大文件被拆分成了我们手动指定的几个小 chunk，每个chunk 大概 200 KB 左右，是一个比较理想的 chunk 体积。这样，当第三方包更新的时候，也只会更新其中一个 chunk 的 url，而不会全量更新，从而提高了第三方包产物的缓存命中率。

除了对象的配置方式之外，我们还可以通过函数进行更加灵活的配置，而 Vite 中的默认拆包策略也是通过函数的方式来进行配置的，我们可以在 Vite 的实现中瞧一瞧:

// Vite 部分源码
function createMoveToVendorChunkFn(config: ResolvedConfig): GetManualChunk {
  const cache = new Map < string,
    boolean > ()
  // 返回值为 manualChunks 的配置
  return (id, {
    getModuleInfo
  }) => {
    // Vite 默认的配置逻辑其实很简单
    // 主要是为了把 Initial Chunk 中的第三方包代码单独打包成`vendor.[hash].js`
    if (
      id.includes('node_modules') &&
      !isCSSRequest(id) &&
      // 判断是否为 Initial Chunk
      staticImportedByEntry(id, getModuleInfo, cache)
    ) {
      return 'vendor'
    }
  }
}

Rollup 会对每一个模块调用 manualChunks 函数，在 manualChunks 的函数入参中你可以拿到模块 id 及模块详情信息，经过一定的处理后返回 chunk 文件的名称，这样当前 id 代表的模块便会打包到你所指定的 chunk 文件中。我们现在来试着把刚才的拆包逻辑用函数来实现一遍:
```
manualChunks(id) {
  if (id.includes('antd') || id.includes('@arco-design/web-react')) {
    return 'library';
  }
  if (id.includes('lodash')) {
    return 'lodash';
  }
  if (id.includes('react')) {
    return 'react';
  }
}
```
打包后结果如下:
看上去好像各个第三方包的 chunk (如 lodash 、 react 等等)都能拆分出来，但实际上你可以运行 npx vite preview 预览产物，会发现产物根本没有办法运行起来，页面出现白屏，同时控制台出现如下的报错:
这也就是函数配置的坑点所在了，虽然灵活而方便，但稍不注意就陷入此类的产物错误问题当中。
那上面的这个报错究竟是什么原因导致的呢？

解决循环引用问题

从报错信息追溯到产物中，可以发现 react-vendor.js 与 index.js 发生了循环引用:

// react-vendor.e2c4883f.js
import { q as objectAssign } from "./index.37a7b2eb.js";
// index.37a7b2eb.js
import { R as React } from "./react-vendor.e2c4883f.js";

这是很典型的 ES 模块循环引用的场景，我们可以用一个最基本的例子来复原这个场景:

// a.js
import { funcB } from './b.js';
funcB();
export var funcA = () => {
 console.log('a');
} 
// b.js
import { funcA } from './a.js';
funcA();
export var funcB = () => {
 console.log('b')
}

接着我们可以执行一下 a.js 文件

<!DOCTYPE html>
<html lang="en">
<head>
 <meta charset="UTF-8">
 <title>Document</title>
</head>
<body>
 <script type="module" src="/a.js"></script>
</body>
</html>

在浏览器中打开会出现类似的报错
代码的执行原理如下:
- JS 引擎执行 a.js 时，发现引入了 b.js ，于是去执行 b.js
- 引擎执行 b.js ，发现里面引入了 a.js (出现循环引用)，认为 a.js 已经加载完成，继续往下执行
- 执行到 funcA() 语句时发现 funcA 并没有定义，于是报错
而对于如上打包产物的执行过程也是同理
可能你会有疑问: react-vendor 为什么需要引用 index.js 的代码呢？其实也很好理解，我们之前在 munaulChunks 中仅仅将路径包含 react 的模块打包到 react-vendor 中，殊不知，像 object-assign 这种 react 本身的依赖并没有打包进 react-vendor 中，而是打包到另外的 chunk 当中，从而导致循环依赖关系
那我们能不能避免这种问题呢？当然是可以的，之前的 manualChunks 逻辑过于简单粗暴，仅仅通过路径 id 来决定打包到哪个 chunk 中，而漏掉了间接依赖的情况。如果针对像 object-assign 这种间接依赖，我们也能识别出它属于 react 的依赖，将其自动打包到 react-vendor 中，这样就可以避免循环引用的问题。我们来梳理一下解决的思路
- 确定 react 相关包的入口路径。
- 在 manualChunks 中拿到模块的详细信息，向上追溯它的引用者，如果命中 react 的路径，则将模块放到 react-vendor 中

接下来让我们进行实际代码的实现

// 确定 react 相关包的入口路径
const chunkGroups = {
  'react-vendor': [
    require.resolve('react'),
    require.resolve('react-dom')
  ],
}
// Vite 中的 manualChunks 配置
function manualChunks(id, {
  getModuleInfo
}) {
  for (const group of Object.keys(chunkGroups)) {
    const deps = chunkGroups[group];
    if (
      id.includes('node_modules') &&
      // 递归向上查找引用者，检查是否命中 chunkGroups 声明的包
      isDepInclude(id, deps, [], getModuleInfo)
    ) {
      return group;
    }
  }
}

实际上核心逻辑包含在 isDepInclude 函数，用来递归向上查找引用者模块:

// 缓存对象
const cache = new Map();

function isDepInclude (id: string, depPaths: string[], importChain: string[], getModuleInfo): boolean | undefined  {
  const key = `${id}-${depPaths.join('|')}`;
  // 出现循环依赖，不考虑
  if (importChain.includes(id)) {
    cache.set(key, false);
    return false;
  }
  // 验证缓存
  if (cache.has(key)) {
    return cache.get(key);
  }
  // 命中依赖列表
  if (depPaths.includes(id)) {
    // 引用链中的文件都记录到缓存中
    importChain.forEach(item => cache.set(`${item}-${depPaths.join('|')}`, true));
    return true;
  }
  const moduleInfo = getModuleInfo(id);
  if (!moduleInfo || !moduleInfo.importers) {
    cache.set(key, false);
    return false;
  }
  // 核心逻辑，递归查找上层引用者
  const isInclude = moduleInfo.importers.some(
    importer => isDepInclude(importer, depPaths, importChain.concat(id), getModuleInfo)
  );
  // 设置缓存
  cache.set(key, isInclude);
  return isInclude;
};

对于这个函数的实现，有两个地方需要大家注意:
- 我们可以通过 manualChunks 提供的入参 getModuleInfo 来获取模块的详情 moduleInfo ，然后通过 moduleInfo.importers 拿到模块的引用者，针对每个引用者又可以递归地执行这一过程，从而获取引用链的信息。
- 尽量使用缓存。由于第三方包模块数量一般比较多，对每个模块都向上查找一遍引用链会导致开销非常大，并且会产生很多重复的逻辑，使用缓存会极大加速这一过程。
完成上述 manualChunks 的完整逻辑后，现在我们来执行 $ npm run build 来进行打包:
可以发现 react-vendor 可以正常拆分出来，查看它的内容:
从中你可以看出 react 的一些间接依赖已经成功打包到了 react-vendor 当中，执行 $ npx view preview 预览产物页面也能正常渲染了:
说明循环依赖的问题已经被我们解决掉了

终极解决方案

尽管上述的解决方案已经能帮我们正常进行产物拆包，但从实现上来看，还是显得略微繁琐，那么有没有开箱即用的拆包方案，能让我们直接用到项目中呢？
答案是肯定的，接下来我就给大家介绍 Vite 自定义拆包的终极解决方案—— viteplugin-chunk-split 。
首先安装一下这个插件: $ pnpm i vite-plugin-chunk-split -D

然后你可以在项目中引入并使用:

// vite.config.ts
import { chunkSplitPlugin } from 'vite-plugin-chunk-split';

export default {
  chunkSplitPlugin({
    // 指定拆包策略
    customSplitting: {
      // 1. 支持填包名。`react` 和 `react-dom` 会被打包到一个名为`render-vendor`的 chunk 里面(包括它们的依赖，如 object-assign)
      'react-vendor': ['react', 'react-dom'],
      // 2. 支持填正则表达式。src 中 components 和 utils 下的所有文件被会被打包为`component-util`的 chunk 中
      'components-util': [/src\/components/, /src\/utils/]
    }
  })
}