JS模块加载器加载原理及实现一个CMD模块加载器

最新推荐文章于 2024-08-28 08:04:11 发布

似曾相识-

最新推荐文章于 2024-08-28 08:04:11 发布

阅读量1.6k

点赞数 1

分类专栏：前端性能/框架文章标签：模块加载器 js模块加载

前端性能/框架专栏收录该内容

37 篇文章 0 订阅

订阅专栏

一、（1）原理一： id即路径 原则。
通常我们的入口是这样的： require( [ 'a', 'b' ], callback ) 。这里的 'a'、'b' 都是 ModuleId。通过 id 和路径的对应原则，加载器才能知道需要加载的 js 的路径。在这个例子里，就是 baseUrl + 'a.js' 和 baseUrl + 'b.js'。

但 id 和 path 的对应关系并不是永远那么简单，比如在 AMD 规范里就可以通过配置 Paths 来给特定的 id 指配 path。

（2）原理二：createElement('script') & appendChild
知道路径之后，就需要去请求。一般是通过 createElement('script') & appendChild 去请求。这个大家都知道，不多说。有时候有的加载器也会通过 AJAX 去请求脚本内容。

一般来说，需要给 <script> 设置一个属性用来标识模块 id, 作用后面会提到。

（3）原理三：document.currentScript
a.js 里可能是 define( id, factory ) 或者是 define( factory )，后者被称为匿名模块。那么当 define(factory) 被执行的时候，我们怎么知道当前被定义的是哪个模块呢，具体地说，这个匿名模块的实际模块 id 是什么？答案是通过 document.currentScript 获取当前执行的<script>，然后通过上面给 script 设置的属性来得到模块 id。

需要注意的是，低级浏览器是不支持 currentScript 的，这里需要进行浏览器兼容。在高级浏览器里面，还可以通过 script.onload 来处理这个事情。

（4）原理四：依赖分析
在继续讲之前，需要先简单介绍下模块的生命周期。模块在被 Define 之后并不是马上可以用了，在你执行它的 factory 方法来生产出最终的 export 之前，你需要保证它的依赖是可用的。那么首先就要先把依赖分析出来。

简单来说，就是通过 toString 这个方法得到 factory 的内容，然后用正则去匹配其中的 require( 'moduleId' )。当然也可以不用正则。

这就是为什么 require( var ); 这种带变量的语句是不被推荐的，因为它会影响依赖分析。如果一定要用变量，可以用 require( [ var ] ) 这种异步加载的方式。

（5）原理五：递归加载
在分析出模块的依赖之后，我们需要递归去加载依赖模块。用伪代码来表达大概是这样的：

Module.prototype.load = function () {
    var deps = this.getDeps();
    for (var i = 0; i < deps.length; i++) {
        var m = deps[i];
        if (m.state < STATUS.LOADED) {
            m.load();
        }
    }
    this.state = STATUS.LOADED;
}

上面的代码只是表达一个意思，实际上 load 方法很可能是异步的，所以递归的返回要特殊处理下。

实现一个可用的加载器并没有那么简单，比如你要处理循环依赖，还有各种各样的牵一发动全身的细节。但要说原理，大概就是这么几条。个人觉得，比起照着规范实现一个加载器，更加吸引人的是 AMD 或者 CommonJS 这些规范的完善和背后的设计思路。

二、实现一个CMD模块加载器

cmd 是阿里大神玉伯提出的基于浏览器的前端模块化规范，并在 seajs 中实现了这个规范。相对于另一个在国外比较流行的前端模块化规范 amd，cmd 对于 nodejs 的使用者来说更加友好，使得类似 commonJS 模块的写法可以在浏览器中使用，同时解决了浏览器中模块异步加载的困扰。关于 cmd 更详细的内容可以移步 https://github.com/cmdjs/specification/blob/master/draft/module.md 今天，我们一起来学习如何实现一个浏览器端的简单的 cmd loader。

模块加载流程

下图展示了一个 cmd loader 的模块加载大体流程：

首先，通过 use 方法来加载入口模块，并接收一个回调函数，当模块加载完成，会调用回调函数，并传入对应的模块。use 方法会 check 模块有没有缓存，如果有，则从缓存中获取模块，如果没有，则创建并加载模块。
获取到模块后，模块可能还没有 load 完成，所以需要在模块上绑定一个 "complete" 事件，模块加载完成会触发这个事件，这时候才调用回调函数。
创建一个模块时，id就是模块的地址，通过创建 script 标签的方式异步加载模块的代码（factory），factory 加载完成后，会 check factory 中有没有 require 别的子模块:
- 如果有，继续加载其子模块，并在子模块上绑定 "complete" 事件，来触发本身的 "complete" 事件；
- 如果没有则直接触发本身的 "complete" 事件。
如果子模块中还有依赖，则会递归这个过程。
通过事件由里到外的传递，当所有依赖的模块都 complete 的时候，最外层的入口模块才会触发 "complete" 事件，use 方法中的回调函数才会被调用。

功能划分

理解了整个过程，那么我们就来开始实现我们的代码，我们暂且给这个加载器命名为 mcmd 吧。首先是加载器的功能模块划分：

mcmd：入口文件，用于定义默认配置，参数，常量等，同时使用或加载其他的功能模块；
define：实现 cmd 中的 "define" 方法；
require：实现 cmd 中的 "require" 方法；
use：实现 cmd 中的 "use" 方法；
module：模块类，实现模块的创建、加载、事件等功能；
load：用于获取模块，把模块从新建和从 cache 中获取封装成统一的接口；
promise：异步任务处理器；
util：工具类函数；

构建

我们使用 commonJS 的方式进行编码，并使用 browserify 配合 gulp 来构建我们的项目。

var gulp = require('gulp');
var uglify = require('gulp-uglify');
var concat = require('gulp-concat');
var browserify = require('browserify');
var source = require('vinyl-source-stream');
var buffer = require('vinyl-buffer')
var pg = require('./package');
var versionName = pg.name + '.' + pg.version
gulp.task('default', ['build']);
gulp.task('build', function () {
	browserify('./src/mcmd.js')
		.bundle()
		.pipe(source(versionName))
		.pipe(buffer())
		.pipe(concat(versionName + '.js'))
		.pipe(gulp.dest('./prd'))
		.pipe(uglify())
		.pipe(concat(versionName + '.min.js'))
		.pipe(gulp.dest('./prd'));
});

确定好了功能划分和构建方式，下面我们就来实现每一个功能模块：

入口文件

将我们的 cmd loader 挂在 window.mcmd 上，把 define 方法也挂在 window.define 上，初始化其他的方法和配置。

var g = window;
g.define = require('./define');
g.mcmd = {
	use: require('./use'),
	require: require('./require'),
	// 模块缓存
	modules: {},
	// 默认配置
	config: {
		root: '/'
	},
	// 修改配置
	setConfig: function (obj) {
		for (var key in obj) {
			this.config[key] = obj[key];
		}
	},
	// 模块状态常量
	MODULE_STATUS: {
		PENDDING: 0,
		LOADING: 1,
		COMPLETED: 2,
		ERROR: 3
	}
};

use.js

实现了 mcmd.use 方法，接收两个参数，第一个是id或者id数组，第二个是回调函数。内部会使用 load.js 来获取模块，并通过 promise 来处理获取多个模块的并发异步场景。

var Promise = require('./promise');
var load = require('./load');
module.exports = function use(ids, callback) {
	if (!Array.isArray(ids)) {
		ids = [ids]
	}
	Promise.all(ids.map(function (id) {
		return load(mcmd.config.root + id);
	})).then(function (list) {
		if (typeof callback === 'function') {
			callback.apply(window, list);
		}
	}, function (errorInfo) {
		throw errorInfo;
	});
}

load.js

获取一个模块，并绑定事件，接收两个参数，一个是模块id，一个是回调函数，并返回一个 promise 对象。当模块 complete（加载完成）时，执行回调，同时 resolve 返回的 promise 对象。

var Promise = require('./promise');
var Module = require('./module');
var util = require('./util');
module.exports = function (id, callback) {
	return new Promise(function (resolve, reject) {
		var mod =  mcmd.modules[id] || Module.create(id);
		mod.on('complete', function () {
			var exp = util.getModuleExports(mod);
			if (typeof callback === 'function') {
				callback(exp);
			}
			resolve(exp);
		});
		mod.on('error', reject);
	});
}

promise.js

详见： http://annn.me/ecmascript6-promise

module.js

模块的构造函数，实现了模块的创建，加载，事件传递，状态维护等。

// 构造函数
function Module(id) {
	mcmd.modules[id] = this; // 缓存模块
	this.id = id;
	this.status = mcmd.MODULE_STATUS.PENDDING; // 状态
	this.factory = null;	// 执行代码
	this.dependences = null;	//依赖
	this.callbacks = {};	// 绑定的事件回调函数
	this.load();
}
// 静态方法创建模块
Module.create = function (id) {
	return new Module(id);
}
// 通过创建 script 标签异步加载模块
Module.prototype.load = function () {
	var id = this.id;
	var script = document.createElement('script');
	script.src = id;
	script.onerror = function (event) {
		this.setStatus(mcmd.MODULE_STATUS.ERROR, {
			id: id,
			error: (this.error = new Error('module can not load.'))
		});
	}.bind(this);
	document.head.appendChild(script);
	this.setStatus(mcmd.MODULE_STATUS.LOADING);
}
// 事件绑定方法
Module.prototype.on = function (event, callback) {
	(this.callbacks[event] || (this.callbacks[event] = [])).push(callback);
	if (
		(this.status === mcmd.MODULE_STATUS.LOADING && event === 'load') ||
		(this.status === mcmd.MODULE_STATUS.COMPLETED && event === 'complete')
	) {
		callback(this);
	}
	if (this.status === mcmd.MODULE_STATUS.ERROR && event === 'error') {
		callback(this, this.error);
	}
}
// 事件触发方法
Module.prototype.fire = function (event, arg) {
	(this.callbacks[event] || []).forEach(function (callback) {
		callback(arg || this);
	}.bind(this));
}
// 设置状态方法，并抛出相应的事件
Module.prototype.setStatus = function (status, info) {
	if (this.status !== status) {
		this.status = status;
		switch (status) {
			case mcmd.MODULE_STATUS.LOADING:
				this.fire('load');
				break;
			case mcmd.MODULE_STATUS.COMPLETED:
				this.fire('complete');
				break;
			case mcmd.MODULE_STATUS.ERROR:
				this.fire('error', info);
				break;
			default:
				break;
		}
	}
}
module.exports = Module;

define.js

实现 window.define 方法。接收一个参数 factory（cmd规范中不止一个，为了保持简单，我们只实现一个），即模块的代码包裹函数。通过 getCurrentScript 这个函数获取到当前执行脚本的 script 节点 src ，提取出模块 id ，找到模块对象。然后提取出 factory 中的依赖子模块，如果没有依赖，则直接触发模块的 "complete" 事件，如果有依赖，则创建依赖的模块，绑定事件并加载，等依赖的模块加载完成后，再触发 "complete" 事件。

var util = require('./util');
var Promise = require('./promise');
var Module = require('./module');
module.exports = function (factory) {
	var id = getCurrentScript().replace(location.origin, '');
	var mod = mcmd.modules[id];
	var dependences = mod.dependences = getDenpendence(factory.toString());
	mod.factory = factory;
	if (dependences) {
		Promise.all(dependences.map(function (id) {
			return new Promise(function (resolve, reject) {
				id = mcmd.config.root + id;
				var depMode = mcmd.modules[id] || Module.create(id);
				depMode.on('complete', resolve);
				depMode.on('error', reject);
			});
		})).then(function () {
			mod.setStatus(mcmd.MODULE_STATUS.COMPLETED);
		}, function (error) {
			mod.setStatus(mcmd.MODULE_STATUS.ERROR, error);
		});
	}
	else {
		mod.setStatus(mcmd.MODULE_STATUS.COMPLETED);
	}
}
// 获取当前执行的script节点
// 参考 http://www.cnblogs.com/rubylouvre/archive/2013/01/23/2872618.html
function getCurrentScript() {
	var doc = document;
	if(doc.currentScript) {
		return doc.currentScript.src;
	}
	var stack;
	try {
		a.b.c();
	} catch(e) {
		stack = e.stack;
		if(!stack && window.opera){
			stack = (String(e).match(/of linked script \S+/g) || []).join(" ");
		}
	}
	if(stack) {
		stack = stack.split( /[@ ]/g).pop();
		stack = stack[0] == "(" ? stack.slice(1,-1) : stack;
		return stack.replace(/(:\d+)?:\d+$/i, "");
	}
	var nodes = head.getElementsByTagName("script");
	for(var i = 0, node; node = nodes[i++];) {
		if(node.readyState === "interactive") {
			return node.className = node.src;
		}
	}
}
// 解析依赖，这里只做简单的提取，实际需要考虑更多情况，参考seajs
function getDenpendence(factory) {
	var list = factory.match(/require\(.+?\)/g);
	if (list) {
		list = list.map(function (dep) {
			return dep.replace(/(^require\(['"])|(['"]\)$)/g, '');
		});
	}
	return list;
}

require.js

返回模块的 exports 属性，这里通过封装的 util.getModuleExports 方法获取并返回。

var util = require('./util');
module.exports = function (id) {
	id = mcmd.config.root + id;
	var mod = mcmd.modules[id];
	if (mod) {
		return util.getModuleExports(mod);
	}
	else {
		throw 'can not get module by from:' + id;
	}
}
module.exports.async = function (ids, callback) {
	mcmd.use(ids, callback);
}

util.js

这里只有一个 getModuleExports 方法，接收一个模块，返回模块的接口。当模块的 exports 属性不存在时，说明模块的 factory 没有被执行过。这时我们需要执行下 factory，传入 require，创建的exports，以及 module 本身作为参数。最后获取模块的暴露的数据并返回。

module.exports = {
	getModuleExports: function (mod) {
		if (!mod.exports) {
			mod.exports = {};
			mod.factory(mcmd.require, mod.exports, mod);
		}
		return mod.exports;
	}
};

这样，整个 cmd loader 就基本完成了。这只是一个非常基础的模块加载器，主要是为了理解 cmd 的原理和实现方式，对于生产环境，推荐使用成熟的 seajs。

整个 mcmd 项目我都放在了 github 上，大家可以去看看： https://github.com/hanan198501/mcmd 。

实现一个CMD模块加载器

似曾相识-

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
JS模块加载器加载原理及实现一个CMD模块加载器

一、（1）原理一：id即路径原则。通常我们的入口是这样的： require( [ 'a', 'b' ], callback ) 。这里的 'a'、'b' 都是 ModuleId。通过 id 和路径的对应原则，加载器才能知道需要加载的 js 的路径。在这个例子里，就是 baseUrl + 'a.js' 和 baseUrl + 'b.js'。但 id 和 path 的对应关系并不是永远那
复制链接

扫一扫

专栏目录