JS—线程-进程与事件机制

最新推荐文章于 2024-05-03 00:04:39 发布

先模仿再超越

最新推荐文章于 2024-05-03 00:04:39 发布

阅读量782

点赞数 1

文章标签： javascript

本文链接：https://blog.csdn.net/qq_51220629/article/details/125174554

版权

进程与线程

首先需要理解一句话：进程是CPU分配资源的最小单位（是能拥有资源和独立运行的最小单位，进程之间不会共享资源），线程是CPU调度的最小单位（线程是建立在进程的基础上的一次程序运行单位，一个进程中可以有多个线程，多个线程之间共享进程的资源）。

进程与线程之间的关系可以理解为：火车与车厢的关系

1）拥有资源

进程是资源分配的基本单位，但是线程不拥有资源，线程间可以共享进程的所有资源。
一个进程可以包含多个线程，不同进程间数据很难共享，同一进程下不同线程间数据很容易共享，进程间不会相互影响，一个线程挂掉可能影响整个进程挂掉。

2）系统开销

进程有自己的独立地址空间，每启动一个进程，系统就会为它分配地址空间，建立数据表来维护代码段、堆栈段和数据段，操作昂贵，而线程共享进程资源，使用相同的地址空间，因此线程切换开销要小

多线程容易调度，有效地实现并发性。对内存的开销比较小。创建线程比创建进程要快。

浏览器中的进程与线程

第一个疑惑：浏览器中的一个页面是一个进程还是线程？

Chrome的每个标签页（Tab）都是一个进程。为什么呢？

安全性：相比于线程，进程之间是不共享资源和地址空间的,所以不会存在太多的安全问题，而由于多个线程共享着相同的地址空间和资源,所以会存在线程之间有可能会恶意修改或者获取非授权数据的可能。

健壮性：由于多个线程共享同一个进程的地址空间和相关的资源, 所以当一个线程出现crash,那么可能会导致相应的地址空间和资源会出现问题,从而导致其它的线程也crash。当一个tab突然崩溃时,所有的tab都会崩溃,这时通常浏览器要重启(重启进程,重新生成线程)。而多进程则不存在这个问题, 因为不同的地址空间和资源, 当一个进程崩溃时, 并不会影响到其它进程。

性能：进程的安全性,健壮性是建立在独立的地址空间和独立的资源的条件下的, 所以进程的启动,关闭,切换相比于线程会有更多的开销。而这种开销的差别在Windows下更加显著。

第二个疑惑：浏览器包含哪些进程呢？

1、Browser进程（只有一个）：浏览器的主进程，负责浏览器界面显示，与用户交互（如前进或者后退页面）、管理各个页面，创建和销毁其他进程、将渲染进程在内存得到Bitmap，绘制到用户界面上、网络资源的下载。

2、第三方插件进程：每种类型的插件对应一个进程，只有在使用插件时才会创建。

3、GPU进程：最多创建一个，用于3D绘制。

4、浏览器渲染进程（浏览器内核，Renderer进程）：内部是多线程，默认一个tab页面对应一个进程，互不影响（有些进程会被合并），对页面进行渲染，执行脚本，事件处理。

第三个疑惑：浏览器中的Renderer进程又包含几个线程呢？

上图是Renderer进程中的主要线程：

1.GUI渲染线程

1）负责渲染浏览器界面，解析HTML，CSS，构建DOM树和RenderObject树，布局和绘制
2）当界面需要重绘(Repaint)或由于某种操作引发回流(reflow)时，该线程就会执行
3）与JS引擎互斥，当执行JS引擎线程时，GUI会pending，当任务队列空闲时，才会继续执行GUI

2.JS引擎线程

1）也称为JS内核，负责处理javascript脚本程序
2）JS引擎线程负责解析Javascript脚本，运行代码
3）JS引擎一直等待任务队列中任务的到来，然后加以处理，浏览器无论什么时候都只有一个JS线程在运行JS程序
4）同样注意，GUI渲染线程与JS引擎线程时互斥的，所以如果JS执行的时间过长，这样就会造成页面的渲染不连贯，导致页面渲染加载阻塞。

3.事件触发线程

1）事件触发线程归属于浏览器而不是JS引擎(辅助JS引擎)，用来控制事件循环(存在一个事件队列)
2）当JS引擎执行代码块如setTimeOut时(也可来自浏览器内核的其他线程，如鼠标点击，Ajax异步请求等)，会将对应的任务添加到事件线程中
3）当对应的事件符合触发条件被触发时，该线程会把事件添加到待处理队列的队尾，等待JS引擎的处理
4）注意，由于JS的单线程关系，所以这些待处理队列的事件都得排队等待JS引擎的处理(当JS引擎空闲时才会去执行)

4.定时触发器线程

1）setInterval、setTimeOut所在线程
2）浏览器定时计数器并不是由JavaScript引擎计数的，(因为JavaScript引擎时单线程的，如果处于阻塞线程状态就会影响计时的准确)
3）因此通过单独线程来计时并触发(计时完毕后，添加到事件队列中，等待JS引擎空闲后执行)
4）注意，W3C在HTML标准中规定要求setTimeOut中低于4ms的时间间隔为4ms

5.异步HTTP请求线程(IO线程)

1）在XMLHttpRequest在连接后是通过浏览器新开一个线程请求
2）将检测到状态变更时，如果设置有回调函数，异步线程就产生状态变更事件，将这个回调再放入事件队列中(放入事件触发线程中)。再由JavaScript引擎执行。 3）javascript存在异步执行，通过事件循环机制（event loop）实现执行。

总结：

浏览器是多进程的。
js执行的主线程为JS引擎，并且无论何时都只有一个JS线程在运行，所以是单线程执行。
GUI渲染线程和JS引擎线程是互斥的，并且JS会阻塞页面的加载和渲染。
定时器(setInterval,setTimeout)会在定时器触发器线程中进行计时。
定时触发器线程计时结束后需要执行的事件和异步HTTP请求线程的回调事件都会进入到事件触发线程的任务队列中等待JS引擎的执行。

其他浏览器的内核与JS引擎参考：浏览器内核与JS引擎 - 走看看

事件机制（Event Loop）

为什么JavaScript是单线程

JavaScript语言的一大特点就是单线程，也就是说，同一个时间只能做一件事。那么，为什么JavaScript不能有多个线程呢？这样能提高效率啊。

JavaScript的单线程，与它的用途有关。作为浏览器脚本语言，JavaScript的主要用途是与用户互动，以及操作DOM。这决定了它只能是单线程，否则会带来很复杂的同步问题。比如，假定JavaScript同时有两个线程，一个线程在某个DOM节点上添加内容，另一个线程删除了这个节点，这时浏览器应该以哪个线程为准？

所以，为了避免复杂性，从一诞生，JavaScript就是单线程，这已经成了这门语言的核心特征，将来也不会改变。

任务队列

单线程就意味着，所有任务需要排队，前一个任务结束，才会执行后一个任务。如果前一个任务耗时很长，后一个任务就不得不一直等着。

如果排队是因为计算量大，CPU忙不过来，倒也算了，但是很多时候CPU是闲着的，因为IO设备（输入输出设备）很慢（比如Ajax操作从网络读取数据），不得不等着结果出来，再往下执行。

JavaScript语言的设计者意识到，这时主线程完全可以不管IO设备，挂起处于等待中的任务，先运行排在后面的任务。等到IO设备返回了结果，再回过头，把挂起的任务继续执行下去。

于是，所有任务可以分成两种，一种是同步任务（synchronous），另一种是异步任务（asynchronous）。

同步任务指的是，在主线程上排队执行的任务，只有前一个任务执行完毕，才能执行后一个任务；异步任务指的是，不进入主线程、而进入"任务队列"（task queue）的任务，只有"任务队列"通知主线程，某个异步任务可以执行了，该任务才会进入主线程执行。

异步执行运行机制：

（1）所有同步任务都在主线程上执行，形成一个执行栈（execution context stack）。

（2）主线程之外，还存在一个"任务队列"（task queue）。只要异步任务有了运行结果，就在"任务队列"之中放置一个事件。

（3）一旦"执行栈"中的所有同步任务执行完毕，系统就会读取"任务队列"，看看里面有哪些事件。那些对应的异步任务，于是结束等待状态，进入执行栈，开始执行。

（4）主线程不断重复上面的第三步。

只要主线程空了，就会去读取"任务队列"，这就是JavaScript的运行机制。这个过程会不断重复。

事件和回调函数

"任务队列"是一个事件的队列（也可以理解成消息的队列），IO设备完成一项任务，就在"任务队列"中添加一个事件，表示相关的异步任务可以进入"执行栈"了。主线程读取"任务队列"，就是读取里面有哪些事件。

"任务队列"中的事件，除了IO设备的事件以外，还包括一些用户产生的事件（比如鼠标点击、页面滚动等等）。只要指定过回调函数，这些事件发生时就会进入"任务队列"，等待主线程读取。

所谓"回调函数"（callback），就是那些会被主线程挂起来的代码。异步任务必须指定回调函数，当主线程开始执行异步任务，就是执行对应的回调函数。

"任务队列"是一个先进先出的数据结构，排在前面的事件，优先被主线程读取。主线程的读取过程基本上是自动的，只要执行栈一清空，"任务队列"上第一位的事件就自动进入主线程。但是，由于存在后文提到的"定时器"功能，主线程首先要检查一下执行时间，某些事件只有到了规定的时间，才能返回主线程。

Event Loop

主线程从"任务队列"中读取事件，这个过程是循环不断的，所以整个的这种运行机制又称为Event Loop（事件循环）。

上图中，主线程运行的时候，产生堆（heap）和栈（stack），栈中的代码调用各种外部API，它们在"任务队列"中加入各种事件（click，load，done）。只要栈中的代码执行完毕，主线程就会去读取"任务队列"，依次执行那些事件所对应的回调函数。

执行栈中的代码（同步任务），总是在读取"任务队列"（异步任务）之前执行。请看下面这个例子。


    var req = new XMLHttpRequest();
    req.open('GET', url);    
    req.onload = function (){};    
    req.onerror = function (){};    
    req.send();

上面代码中的req.send方法是Ajax操作向服务器发送数据，它是一个异步任务，意味着只有当前脚本的所有代码执行完，系统才会去读取"任务队列"。所以，它与下面的写法等价。


    var req = new XMLHttpRequest();
    req.open('GET', url);
    req.send();
    req.onload = function (){};    
    req.onerror = function (){};

也就是说，指定回调函数的部分（onload和onerror），在send()方法的前面或后面无关紧要，因为它们属于执行栈的一部分，系统总是执行完它们，才会去读取"任务队列"。

JS定时器原理

除了放置异步任务的事件，"任务队列"还可以放置定时事件，即指定某些代码在多少时间之后执行。这叫做"定时器"（timer）功能，也就是定时执行的代码。

定时器功能主要由setTimeout()（延时器）和setInterval()（定时器）这两个函数来完成，它们的内部运行机制完全一样，区别在于前者指定的代码是一次性执行，后者则为反复执行。以下主要讨论setTimeout()。

setTimeout()接受两个参数，第一个是回调函数，第二个是推迟执行的毫秒数。


console.log(1);
setTimeout(function(){console.log(2);},1000);
console.log(3);

上面代码的执行结果是1，3，2，因为setTimeout()将第二行推迟到1000毫秒之后执行。

如果将setTimeout()的第二个参数设为0，就表示当前代码执行完（执行栈清空）以后，立即执行（0毫秒间隔）指定的回调函数。


setTimeout(function(){console.log(1);}, 0);
console.log(2);

上面代码的执行结果总是2，1，因为只有在执行完第二行以后，系统才会去执行"任务队列"中的回调函数。

总之，setTimeout(fn,0)的含义是，指定某个任务在主线程最早可得的空闲时间执行，也就是说，尽可能早得执行。它在"任务队列"的尾部添加一个事件，因此要等到同步任务和"任务队列"现有的事件都处理完，才会得到执行。

需要注意的是，setTimeout()只是将事件插入了"任务队列"，必须等到当前代码（执行栈）执行完，主线程才会去执行它指定的回调函数。要是当前代码耗时很长，有可能要等很久，所以并没有办法保证，回调函数一定会在setTimeout()指定的时间执行。

再举一个例子：

for (var i = 0; i < 5; i++) {
	console.log(i);
	setTimeout(function timer() {
		console.log(i);
	}, i * 1000);
}

同理，只有主线程上的所有同步任务执行完成后，主线程才会读取任务队列上的异步任务，所以先输出0，1，2，3，4再输出5个5

参考文章：JavaScript 从浏览器多进程到JS单线程，JS运行机制最全面的一次梳理_王维璋的博客-CSDN博客

JavaScript 运行机制详解：再谈Event Loop - 阮一峰的网络日志

先模仿再超越

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
JS—线程-进程与事件机制

线程，进程，浏览器中的线程与进程，JS事件循环机制，定时器原理
复制链接

扫一扫