什么是Node.js呢?
我们先看一下官方对Node.js的定义:
Node.js是一个基于V8 JavaScript引擎的JavaScript运行时环境。
但是这句话对于很多同学来说,非常笼统:
什么是JavaScript运行环境?
为什么JavaScript需要特别的运行环境呢?
什么又是JavaScript引擎?
什么是V8?
我们先来把这些概念搞清楚,再去看Node到底是什么?
JavaScript无处不在
Stack Overflow的创立者之一的 Jeff Atwood 在2007年提出了著名的 Atwood定律:
Any application that can be written in JavaScript, will eventually be written in JavaScript.
任何可以使用JavaScript来实现的应用都最终都会使用JavaScript实现。
但是在发明之初,JavaScript的目的是应用于在浏览器执行简单的脚本任务,对浏览器以及其中的DOM进行各种操作,所以JavaScript的应用场景非常受限。
Atwood定律更像是一种美好的远景,在当时看来还没有实现的可能性。
但是随着Node的出现,Atwood定律已经越来越多的被证实是正确的。
但是为了可以理解Node.js到底是如何帮助我们做到这一点的,我们必须了解JavaScript是如何被运行的。
浏览器内核是什么?
大家有没有深入思考过:JavaScript代码,在浏览器中是如何被执行的?
我们经常会说:不同的浏览器有不同的内核组成
Gecko:早期被Netscape和Mozilla Firefox浏览器使用;
Trident:微软开发,被IE4~IE11浏览器使用,但是Edge浏览器已经转向Blink;
Webkit:苹果基于KHTML开发、开源的,用于Safari,Google Chrome之前也在使用;
Blink:是Webkit的一个分支,Google开发,目前应用于Google Chrome、Edge、Opera等;
等等…
事实上,我们经常说的浏览器内核指的是浏览器的排版引擎:
排版引擎(layout engine),也称为浏览器引擎(browser engine)、页面渲染引擎(rendering engine) 或样版引擎。
渲染引擎工作的过程
但是在这个执行过程中,HTML解析的时候遇到了JavaScript标签,应该怎么办呢?
会停止解析HTML,而去加载和执行JavaScript代码;
当然,为什么不直接异步去加载执行JavaScript代码,而要在这里停止掉呢?
这是因为JavaScript代码可以操作我们的DOM;
所以浏览器希望将HTML解析的DOM和JavaScript操作之后的DOM放到一起来生成最终的DOM树,而不频繁的去生成新的DOM树;
那么,JavaScript代码由谁来执行呢?
JavaScript引擎
JavaScript引擎
为什么需要JavaScript引擎呢?
事实上我们编写的JavaScript无论你交给浏览器或者Node执行,最后都是需要被CPU执行的;
但是CPU只认识自己的指令集,实际上是机器语言,才能被CPU所执行;
所以我们需要JavaScript引擎帮助我们将JavaScript代码翻译成CPU指令来执行;
比较常见的JavaScript引擎有哪些呢?
SpiderMonkey:第一款JavaScript引擎,由Brendan Eich开发(也就是JavaScript作者);
Chakra:微软开发,用于IT浏览器;
JavaScriptCore:WebKit中的JavaScript引擎,Apple公司开发;
V8:Google开发的强大JavaScript引擎,也帮助Chrome从众多浏览器中脱颖而出;
WebKit内核
这里我们先以WebKit为例,WebKit事实上由两部分组成的:
WebCore:负责HTML解析、布局、渲染等等相关的工作;
JavaScriptCore:解析、执行JavaScript代码;
看到这里,学过小程序的同学有没有感觉非常的熟悉呢?
在小程序中编写的JavaScript代码就是被JSCore执行的;
另外一个强大的JavaScript引擎就是V8引擎。
V8引擎
我们来看一下官方对V8引擎的定义:
V8是用C + + 编写的Google开源高性能JavaScript和WebAssembly引擎,它用于Chrome和Node.js等。
它实现ECMAScript和WebAssembly,并在Windows 7或更高版本,macOS 10.12+和使用x64,IA-32,ARM或MIPS处理器的Linux系统上运行。
V8可以独立运行,也可以嵌入到任何C + + 应用程序中。
V8引擎的原理
V8引擎本身的源码非常复杂,大概有超过100w行C + +代码,但是我们可以简单了解一下它执行JavaScript代码的原理:
Parse模块会将JavaScript代码转换成AST(抽象语法树),这是因为解释器并不直接认识JavaScript代码;
如果函数没有被调用,那么是不会被转换成AST的;
Parse的V8官方文档:https://v8.dev/blog/scanner
Ignition是一个解释器,会将AST转换成ByteCode(字节码)
同时会收集TurboFan优化所需要的信息(比如函数参数的类型信息,有了类型才能进行真实的运算);
如果函数只调用一次,Ignition会执行解释执行ByteCode;
Ignition的V8官方文档:https://v8.dev/blog/ignition-interpreter
TurboFan是一个编译器,可以将字节码编译为CPU可以直接执行的机器码;
如果一个函数被多次调用,那么就会被标记为热点函数,那么就会经过TurboFan转换成优化的机器码,提高代码的执行性能;
但是,机器码实际上也会被还原为ByteCode,这是因为如果后续执行函数的过程中,类型发生了变化(比如sum函数原来执行的是number类型,后来执行变成了string类型),之前优化的机器码并不能正确的处理运算,就会逆向的转换成字节码;
TurboFan的V8官方文档:https://v8.dev/blog/turbofan-jit
上面是JavaScript代码的执行过程,事实上V8的内存回收也是其强大的另外一个原因,不过这里暂时先不展开讨论:
Orinoco模块,负责垃圾回收,将程序中不需要的内存回收;
Orinoco的V8官方文档:https://v8.dev/blog/trash-talk
回顾:Node.js是什么
回顾:官方对Node.js的定义:
Node.js是一个基于V8 JavaScript引擎的JavaScript运行时环境。
也就是说Node.js基于V8引擎来执行JavaScript的代码,但是不仅仅只有V8引擎:
前面我们知道V8可以嵌入到任何C + + 应用程序中,无论是Chrome还是Node.js,事实上都是嵌入了V8引擎来执行JavaScript代码;
但是在Chrome浏览器中,还需要解析、渲染HTML、CSS等相关渲染引擎,另外还需要提供支持浏览器操作的API、浏览器自己的事件循环等;
另外,在Node.js中我们也需要进行一些额外的操作,比如文件系统读/写、网络IO、加密、压缩解压文件等操作;
浏览器和Node.js架构区别
我们可以简单理解规划出Node.js和浏览器的差异:
Node.js架构
我们来看一个单独的Node.js的架构图:
我们编写的JavaScript代码会经过V8引擎,再通过Node.js的Bindings,将任务放到Libuv的事件循环中;
libuv(Unicorn Velociraptor—独角伶盗龙)是使用C语言编写的库;
libuv提供了事件循环、文件系统读写、网络IO、线程池等等内容;
具体内部代码的执行流程,我会在后续专门讲解事件和异步IO的原理中详细讲解;
Node.js的应用场景
Node.js的快速发展也让企业对Node.js技术越来越重视,在前端招聘中通常会对Node.js有一定的要求,特别对于高级前端开发
工程师,Node.js更是必不可少的技能:
目前前端开发的库都是以node包的形式进行管理;
npm、yarn工具成为前端开发使用最多的工具;
越来越多的公司使用Node.js作为web服务器开发;
大量项目需要借助Node.js完成前后端渲染的同构应用;
资深前端工程师需要为项目编写脚本工具(前端工程师编写脚本通常会使用JavaScript,而不是Python或者shell);
很多企业在使用Electron来开发桌面应用程序;
Node的安装
Node.js是在2009年诞生的,目前最新的版本是分别是LTS 12.19.0以及Current 14.13.1:
LTS版本:相对稳定一些,推荐线上环境使用该版本;
Current版本:最新的Node版本,包含很多新特性;
这些我们选择什么版本呢?
如果你是学习使用,可以选择current版本;
如果你是公司开发,建议选择LTS版本;
Node的安装方式有很多:
可以借助于一些操作系统上的软件管理工具,比如Mac上的homebrew,Linux上的yum、dnf等;
也可以直接下载对应的安装包下载安装;
我们选择下载安装,下载自己操作系统的安装包直接安装就可以了:
window选择.msi安装包,Mac选择.pkg安装包,Linux会在后续部署中讲解;
安装过程中会配置环境变量(让我们可以在命令行使用);并且会安装npm(Node Package Manager)工具;
JavaScript代码执行
如果我们编写一个js文件,里面存放JavaScript代码,如何来执行它呢?
目前我们知道有两种方式可以执行:
将代码交给浏览器执行;
将代码载入到node环境中执行;
如果我们希望把代码交给浏览器执行:
需要通过让浏览器加载、解析html代码,所以我们需要创建一个html文件
在html中通过script标签,引入js文件;
当浏览器遇到script标签时,就会根据src加载、执行JavaScript代码;
如果我们希望把js文件交给node执行:
首先电脑上需要安装Node.js环境,安装过程中会自动配置环境变量;
可以通过终端命令node js文件的方式来载入和执行对应的js文件;
Node的REPL
什么是REPL呢?感觉挺高大上
REPL是Read-Eval-Print Loop的简称,翻译为“读 取 -求值-输出”循环;
REPL是一个简单的、交互式的编程环境;
事实上,我们浏览器的console就可以看成一个REPL。
Node也给我们提供了一个REPL环境,我们可以在其中演练简单的代码。
Node程序传递参数
正常情况下执行一个node程序,直接跟上我们对应的文件即可:
node index.js
但是,在某些情况下执行node程序的过程中,我们可能希望给node传递一些参数:
node index.js env=development 张三
如果我们这样来使用程序,就意味着我们需要在程序中获取到传递的参数:
获取参数其实是在process的内置对象中的;
如果我们直接打印这个内置对象,它里面包含特别的信息:
其他的一些信息,比如版本、操作系统等大家可以自行查看,后面用到一些其他的我们还会提到;
现在,我们先找到其中的argv属性:
我们发现它是一个数组,里面包含了我们需要的参数;
为什么叫argv呢?
你可能有个疑问,为什么叫argv呢?
在C /C + +程序中的main函数中,实际上可以获取到两个参数:
argc:argument counter的缩写,传递参数的个数;
argv:argument vector的缩写,传入的具体参数。
✓ vector翻译过来是矢量的意思,在程序中表示的是一种数据结构。
✓ 在C + +、Java中都有这种数据结构,是一种数组结构;
✓ 在JavaScript中也是一个数组,里面存储一些参数信息;
我们可以在代码中,将这些参数信息遍历出来,使用:
Node的输出
console.log
最常用的输入内容的方式:console.log
console.clear
清空控制台:console.clear
console.trace
打印函数的调用栈:console.trace
还有一些其他的方法,其他的一些console方法,可以自己在下面学习研究一下。
https://nodejs.org/dist/latest-v14.x/docs/api/console.html
常见的全局对象
Node中给我们提供了一些全局对象,方便我们进行一些操作:
这些全局对象,我们并不需要从一开始全部一个个学习;
某些全局对象并不常用,具体用到再讲
比如module、exports、require()会在模块化中讲到;
特殊的全局对象
为什么我称之为特殊的全局对象呢?
这些全局对象可以在模块中任意使用,但是在命令行交互中是不可以使用的;
包括: dirname、 filename、exports、module、require()
dirname:获取当前文件所在的路径:
注意:不包括后面的文件名
filename:获取当前文件所在的路径和文件名称:
注意:包括后面的文件名称
global和window的区别
在浏览器中,全局变量都是在window上的,比如有document、setInterval、setTimeout、alert、console等等
在Node中,我们也有一个global属性
但是在浏览器中执行的JavaScript代码,如果我们在顶级范围内通过var定义的一个属性,默认会被添加到window 对象上:
但是在node中,我们通过var定义一个变量,它只是在当前模块中有一个变量,不会放到全局中: