前言
我们常说node并不是一门新的编程语言,他只是javascript的运行时,运行时你可以简单地理解为运行javascript的环境。在大多数情况下我们会在浏览器中去运行javascript,有了node的出现,我们可以在node中去运行javascript,这意味着哪里安装了node或者浏览器,我们就可以在哪里运行javascript。
node模块化的实现
node中是自带模块化机制的,每个文件就是一个单独的模块,并且它遵循的是CommonJS规范(每一个文件就是一个模块,有自己的作用域。在一个文件里面定义的变量、函数、类都是私有的,对其他文件不可见),也就是使用require的方式导入模块,通过module.export的方式导出模块。node模块的运行机制也很简单,其实就是在每一个模块外层包裹了一层函数,有了函数的包裹就可以实现代码间的作用域隔离。你可能会说,我在写代码的时候并没有包裹函数呀,是的的确如此,这一层函数是node自动帮我们实现的,我们可以来测试一下。我们新建一个test.js文件,在第一行打印一个并不存在的变量,比如我们这里打印window,在node中是没有window的。
// test.js
console.log(window);
// 命令行
node test.js
// 报错信息 window未定义(node下的全局变量为globalThis)
console.log(window);
^
ReferenceError: window is not defined......
// 或
(function (exports, require, module, __filename, __dirname) { console.log(window) });
ReferenceError: window is not defined......
可以看到报错的顶层有一个自执行的函数,, 函数中包含exports, require, module, __filename, __dirname这些我们常用的全局变量。自执行函数是前端模块化的实现方案之一,在早期前端没有模块化系统的时代,自执行函数可以很好的解决命名空间的问题,并且模块依赖的其他模块都可以通过参数传递进来。cmd和amd规范也都是依赖自执行函数实现的。在模块系统中,每个文件就是一个模块,每个模块外面会自动套一个函数,并且定义了导出方式 module.exports或者exports,同时也定义了导入方式require。
let moduleA = (function() {
module.exports = Promise;
return module.exports;
})();
require加载模块
require依赖node中的fs模块来加载模块文件,fs.readFile读取到的是一个字符串。在javascrpt中我们可以通过eval或者new Function的方式来将一个字符串转换成js代码来运行。
eval
const name = 'yq';
const str = 'console.log(name)';
eval(str); // yq;
new Function
new Function接收的是一个要执行的字符串,返回的是一个新的函数,调用这个新的函数字符串就会执行了。如果这个函数需要传递参数,可以在new Function的时候依次传入参数,最后传入的是要执行的字符串。比如这里传入参数b,要执行的字符串str。
const b = 3;
const str = 'let a = 1; return a + b';
//这里是字符串b 而不是b变量 b变量会报错 因为传入的'b'fun作用域下的变量名,如果为b变量该变量名就变为了3
const fun = new Function('b', str);
console.log(fun(b, str)); // 4
可以看到eval和Function实例化都可以用来执行javascript字符串,似乎他们都可以来实现 require 模块加载。node中并没有选用他们来实现模块化,eval有一个致命的问题,就是容易被不属于它的变量所影响,而未使用new Function()的原因未知,如下str字符串中并没有定义a,但是确可以使用上面定义的a变量,这显然是不对的,在模块化机制中,str字符串应该具有自身独立的运行空间,自身不存在的变量是不可以直接使用的。
const a = 1
const str = 'console.log(a)'
// 打印 1
eval(str)
// 报错 a未定义
const func = new Function(str)
func()
node存在一个vm虚拟环境的概念,用来运行额外的js文件,他可以保证javascript执行的独立性,不会被外部所影响。
vm 内置模块
虽然我们在外部定义了hello,但是str是一个独立的模块,并不在村hello变量,所以会直接报错。
// 引入vm模块, 不需要安装,node 自建模块
const vm = require('vm');
const hello = 'yq';
const str = 'console.log(hello)';
vm.runInThisContext(str); // 报错
require代码实现
node模块化用法
介绍require代码实现之前先来回顾path和fs模块的基本用法,因为下面会用得到。
path模块
用于处理文件路径。
basename: 基础路径, 有文件路径就不是基础路径,基础路劲是 1.js
extname: 获取扩展名
dirname: 父级路径
join: 拼接路径
resolve: 当前文件夹的绝对路径,注意使用的时候不要在结尾添加 /
__dirname: 当前文件所在文件夹的路径
__filename: 当前文件的绝对路径
const path = require('path', 's')
console.log(path.basename('1.js')) // 1.js
console.log(path.extname('2.txt')) // .txt
console.log(path.dirname('3.txt')) // .
console.log(path.join('a/b/c', 'd/e/f')) // a/b/c/d/e/f
console.log(path.resolve('4.txt')) // /Users/yq/Documents/code/web/node/4.txt
fs模块
用于操作文件或者文件夹,比如文件的读写,新增,删除等。
readFile:同步读取文件,存在返回文件内容
readFileSync:异步读取文件,存在返回文件内容
accessSync:判断文件是否存在,存在返回undefined,否则抛出错误
node10提供的,exists方法已经被废弃, 原因是不符合node规范,所以我们采用access来判断文件是否存在。
try {
const fs = require('fs')
// 检查路径为 ./name.txt 是否存在
console.log(fs.accessSync('./name.txt'));
// 同步读取
fs.readFile('./name.txt', (error, data) => {
console.log(error)
console.log(data.toString())
})
// 异步读取
const syncGetName = fs.readFileSync('./name.txt', 'utf8') // 如果不传入编码,出来的是二进制
console.log(syncGetName)
} catch (e) {
// 文件不存在
console.log(e)
}
// name.txt文件中的数据为yq,以下是控制台打印的值
undefined
yq
null
yq
实现require模块加载器
分析实现步骤
导入相关模块path、fs、vm,创建一个Require方法。
编写储存模块的Module
并在Module上添加定义包裹模块的函数的字符串wrapper和针对不同模块的加载方法_extensions
实现模块加载方法tryModuleLoad
首先导入依赖的模块path,fs, vm, 并且创建一个Require函数,这个函数接收一个modulePath参数,表示要导入的文件路径。
下面我们来实现以下
// 导入依赖
const path = require('path'); // 路径操作
const fs = require('fs'); // 文件读取
const vm = require('vm'); // 文件执行
// 定义导入类,参数为模块路径
function Require(modulePath) {
...
}
在Require中获取到模块的绝对路径,方便使用fs加载模块,这里读取模块内容我们使用new Module来抽象,使用tryModuleLoad来加载模块内容,Module和tryModuleLoad我们稍后实现,Require的返回值应该是模块的内容,也就是module.exports。
// 定义导入类,参数为模块路径
function Require(modulePath) {
// 获取当前要加载的绝对路径
let absPathname = path.resolve(__dirname, modulePath);
// 创建模块,新建Module实例
const module = new Module(absPathname);
// 加载当前模块
tryModuleLoad(module);
// 返回exports对象
return module.exports;
}
Module的实现很简单,就是给模块创建一个exports对象,tryModuleLoad执行的时候将内容加入到exports中,id就是模块的绝对路径。
// 定义模块, 添加文件id标识和exports属性
function Module(id) {
this.id = id;
// 读取到的文件内容会放在exports中
this.exports = {};
}
之前我们说过node模块是运行在一个函数中,这里我们给Module挂载静态属性wrapper,里面定义一下这个函数的字符串,wrapper是一个数组,数组的第一个元素就是函数的参数部分,其中有exports,module. Require,__dirname, __filename, 都是我们模块中常用的全局变量。注意这里传入的Require参数是我们自己定义的Require。第二个参数就是函数的结束部分。两部分都是字符串,使用的时候我们将他们包裹在模块的字符串外部就可以了。
Module.wrapper = [
"(function(exports, module, Require, __dirname, __filename) {",
"})"
]
_extensions用于针对不同的模块扩展名使用不同的加载方式,比如JSON和javascript加载方式肯定是不同的。JSON使用JSON.parse来运行。javascript使用vm.runInThisContext来运行,可以看到fs.readFileSync传入的是module.id也就是我们Module定义时候id存储的是模块的绝对路径,读取到的content是一个字符串,我们使用Module.wrapper来包裹一下就相当于在这个模块外部又包裹了一个函数,也就实现了私有作用域。使用call来执行fn函数,第一个参数改变运行的this我们传入module.exports,后面的参数就是函数外面包裹参数exports, module, Require, __dirname, __filename
Module._extensions = {
'.js'(module) {
const content = fs.readFileSync(module.id, 'utf8');
const fnStr = Module.wrapper[0] + content + Module.wrapper[1];
const fn = vm.runInThisContext(fnStr);
fn.call(module.exports, module.exports, module, Require,_filename,_dirname);
},
'.json'(module) {
const json = fs.readFileSync(module.id, 'utf8');
module.exports = JSON.parse(json); // 把文件的结果放在exports属性上
}
}
tryModuleLoad函数接收的是模块对象,通过path.extname来获取模块的后缀名,然后使用Module._extensions来加载模块。
// 定义模块加载方法
function tryModuleLoad(module) {
// 获取扩展名
const extension = path.extname(module.id);
// 通过后缀加载当前模块
Module._extensions[extension](module);
}
至此Require加载机制我们基本就写完了,我们来重新看一下。Require加载模块的时候传入模块名称,在Require方法中使用 path.resolve(__dirname, modulePath)获取到文件的绝对路径。然后通过new Module实例化的方式创建module对象,将模块的绝对路径存储在module的id属性中,在module中创建exports属性为一个json对象。使用tryModuleLoad方法去加载模块,tryModuleLoad中使用 path.extname获取到文件的扩展名,然后根据扩展名来执行对应的模块加载机制。最终将加载到的模块挂载module.exports中。tryModuleLoad执行完毕之后module.exports已经存在了,直接返回就可以了,我们这里来测试一下当前的代码。
// test.js
module.exports = {
name: 'yq',
}
// require.js
// 导入依赖
const path = require('path') // 路径操作
const fs = require('fs') // 文件读取
const vm = require('vm') // 文件执行
// 定义导入类,参数为模块路径
function Require(modulePath) {
// 获取当前要加载的绝对路径
let absPathname = path.resolve(__dirname, modulePath)
// 创建模块,新建Module实例
const module = new Module(absPathname)
// 加载当前模块
tryModuleLoad(module)
// 返回exports对象
return module.exports
}
// 定义模块, 添加文件id标识和exports属性
function Module(id) {
this.id = id
// 读取到的文件内容会放在exports中
this.exports = {}
}
// 定义包裹模块内容的函数
Module.wrapper = [
'(function(exports, module, Require, __dirname, __filename) {',
'})',
]
// 定义扩展名,不同的扩展名,加载方式不同,实现js和json
Module._extensions = {
'.js'(module) {
const content = fs.readFileSync(module.id, 'utf8')
const fnStr = Module.wrapper[0] + content + Module.wrapper[1]
const fn = vm.runInThisContext(fnStr)
fn.call(
module.exports,
module.exports,
module,
Require,
__filename,
__dirname
)
},
'.json'(module) {
const json = fs.readFileSync(module.id, 'utf8')
module.exports = JSON.parse(json) // 把文件的结果放在exports属性上
},
}
// 定义模块加载方法
function tryModuleLoad(module) {
// 获取扩展名
const extension = path.extname(module.id)
// 通过后缀加载当前模块
Module._extensions[extension](module)
}
// 通过我们自己定义的 Require 导入test.js中导出的data
console.log(Require('./test.js'))
// 命令行
node require.js
{ name: 'yq' }
给模块添加缓存
添加缓存也比较简单,就是文件加载的时候将文件放入缓存,再去加载模块时先看缓存中是否存在,如果存在直接使用,如果不存在再去重新加载,加载之后再放入缓存。
// 定义导入类,参数为模块路径
function Require(modulePath) {
// 获取当前要加载的绝对路径
let absPathname = path.resolve(__dirname, modulePath)
// 创建模块,新建Module实例
const module = new Module(absPathname)
// 从缓存中读取,如果存在,直接返回结果
if (Module._cache && Module._cache[absPathname]) {
console.log(`成功加载${modulePath}的缓存`);
return Module._cache[absPathname].exports
} else {
Module._cache = {}
}
// 尝试加载当前模块
tryModuleLoad(module)
// 添加缓存
Module._cache[absPathname] = module
// 加载当前模块
tryModuleLoad(module)
// 返回exports对象
return module.exports
}
// 定义缓存
Module._cache = {}
自动补全路径
自动给模块添加后缀名,实现省略后缀名加载模块,其实也就是如果文件没有后缀名的时候遍历一下所有的后缀名看一下文件是否存在。
// 定义导入类,参数为模块路径
function Require(modulePath) {
// 获取当前要加载的绝对路径
let absPathname = path.resolve(__dirname, modulePath)
// 存储原始文件路径
// 写法一 有bug
// const extNames = Object.keys(Module._extensions)
// let index = 0
// const oldPath = absPathname
// function findExt(absPathname) {
// if (index === extNames.length) {
// throw new Error('文件不存在')
// }
// try {
// fs.accessSync(absPathname)
// return absPathname // !此处返回的值为undefined 但 absPathname值是正确的 如果有大佬知道原因还请告知
// } catch (e) {
// const ext = extNames[index++]
// findExt(oldPath + ext)
// }
// }
// 写法二
const findExt = (absPathname) => {
try {
fs.accessSync(absPathname)
return absPathname
} catch (error) {
const extNames = Object.keys(Module._extensions)
for (let i = 0; i < extNames.length; i++) {
const ext = extNames[i]
try {
fs.accessSync(absPathname + ext)
return absPathname + ext
} catch (e) {
continue
}
}
}
throw new Error('文件不存在')
}
// 递归追加后缀名,判断文件是否存在
absPathname = findExt(absPathname)
// 从缓存中读取,如果存在,直接返回结果
if (Module._cache && Module._cache[absPathname]) {
console.log(`成功加载${modulePath}的缓存`)
return Module._cache[absPathname].exports
}
// 创建模块,新建Module实例
const module = new Module(absPathname)
// 添加缓存
Module._cache[absPathname] = module
// 加载当前模块
tryModuleLoad(module)
// 返回exports对象
return module.exports
}
带缓存和自动补全路径的源码
/* test.js */
module.exports = {
name: 'yq',
}
/* require.js */
// 导入依赖
const path = require('path') // 路径操作
const fs = require('fs') // 文件读取
const vm = require('vm') // 文件执行
// 定义导入类,参数为模块路径
function Require(modulePath) {
// 获取当前要加载的绝对路径
let absPathname = path.resolve(__dirname, modulePath)
const findExt = (absPathname) => {
try {
fs.accessSync(absPathname)
return absPathname
} catch (error) {
const extNames = Object.keys(Module._extensions)
for (let i = 0; i < extNames.length; i++) {
const ext = extNames[i]
try {
fs.accessSync(absPathname + ext)
return absPathname + ext
} catch (e) {
continue
}
}
}
throw new Error('文件不存在')
}
// 递归追加后缀名,判断文件是否存在
absPathname = findExt(absPathname)
// 从缓存中读取,如果存在,直接返回结果
if (Module._cache && Module._cache[absPathname]) {
console.log(`成功加载${modulePath}的缓存`)
return Module._cache[absPathname].exports
}
// 创建模块,新建Module实例
const module = new Module(absPathname)
// 添加缓存
Module._cache[absPathname] = module
// 加载当前模块
tryModuleLoad(module)
// 返回exports对象
return module.exports
}
// 定义模块, 添加文件id标识和exports属性
function Module(id) {
this.id = id
// 读取到的文件内容会放在exports中
this.exports = {}
}
// 定义缓存
Module._cache = {}
// 定义包裹模块内容的函数
Module.wrapper = [
'(function(exports, module, Require, __dirname, __filename) {',
'})',
]
// 定义扩展名,不同的扩展名,加载方式不同,实现js和json
Module._extensions = {
'.js'(module) {
const content = fs.readFileSync(module.id, 'utf8')
const fnStr = Module.wrapper[0] + content + Module.wrapper[1]
const fn = vm.runInThisContext(fnStr)
fn.call(
module.exports,
module.exports,
module,
Require,
__filename,
__dirname
)
},
'.json'(module) {
const json = fs.readFileSync(module.id, 'utf8')
module.exports = JSON.parse(json) // 把文件的结果放在exports属性上
},
}
// 定义模块加载方法
function tryModuleLoad(module) {
// 获取扩展名
const extension = path.extname(module.id)
// 通过后缀加载当前模块
Module._extensions[extension](module)
}
// 通过我们自己定义的 Require 导入test.js中导出的data
console.log('------------------缓存测试')
console.log(Require('./test.js'))
console.log(Require('./test.js'))
// 目前只支持自动补充js、json
console.log('------------------自动补全扩展名测试')
console.log(Require('./test'))