进程和线程
首先在开头先了解下进程和线程的概念,有助于后面相关概念的理解,往上有很多对于线程和进程的形象举例:
进程:可以比喻成一个工厂,工厂有它的独立资源(每个进程cpu都会分配独立的内存空间),工厂之间相互独立(进程之间相互独立)
线程:可以比喻成工厂中的工人,一个工厂由一个或多个工人组成(一个进程由一个或多个线程组成),同一个工厂下的工人可以共享工厂的资源(同一进程下的各个线程之间共享程序的内存空间,包括代码段、数据集、堆等)
此时为了更加深印象的理解以上概念,你可以打开任务管理器看下,这边显示的都是一个个进程(注:mac系统第一张图,windows系统第二张图,由于手头没有windows电脑,就网上copy了一张)
最后,再用较为官方的术语描述一遍两者的概念:
进程:它是cpu资源分配的最小单位(是能拥有资源和独立运行的最小单位)
线程:它是cpu调度的最小单位(线程是建立在进程的基础上的一次程序运行单位,一个进程中可以有多个线程)
注意:启动一个应用时,会创建一个进程。程序也许会创建一个或多个线程来帮助它工作,这是可选的。操作系统为进程提供了一个可以使用的“一块”内存(块内存),所有应用程序状态都保存在该私有内存空间中。关闭应用程序时,相应的进程也会消失,操作系统会释放内存
浏览器是多进程的
到底包含哪些进程
Browser进程:浏览器的主进程(负责协调、主控),只有一个。作用有
- 负责浏览器界面显示,与用户交互。如前进,后退等
- 负责各个页面的管理,创建和销毁其他进程
- 将Renderer进程得到的内存中的Bitmap,绘制到用户界面上
- 网络资源的管理,下载等
第三方插件进程:每种类型的插件对应一个进程,仅当使用该插件时才创建
GPU进程:最多一个,用于3D绘制等
浏览器渲染进程(浏览器内核)(Renderer进程,内部是多线程的):默认每个Tab页面一个进程,互不影响。主要作用为页面渲染,脚本执行,事件处理等
注意:在浏览器中打开一个网页相当于新起了一个进程(进程内有自己的多线程),当然也有进程合并的情况,就是当你打开多个空白标签页时浏览器会把它们合并成一个进程
浏览器多进程的优势
- 避免单个page 崩溃影响整个浏览器
- 避免第三方插件崩溃影响整个浏览器
- 多进程充分利用多核优势
- 方便使用沙盒模型隔离插件等进程,提高浏览器稳定性
简单理解:如果浏览器是单进程,那么某个Tab页崩溃了,就影响了整个浏览器,体验有多差;同理如果是单进程,插件崩溃了也会影响整个浏览器;而且多进程还有其它的诸多优势。。。
浏览器内核(渲染进程/Renderer进程)
接下来我们重点来讲讲这个浏览器内核(渲染进程),因为页面的渲染,JS的执行,事件的循环,都在这个进程内进行,对于前端开发者来说,主要要关心的也就是这个进程
浏览器内核(渲染进程)它是多线程的,请记住这点,那我们来看看它到底有哪些线程:
-
GUI渲染引擎线程
- 负责渲染浏览器界面,解析HTML,CSS,构建DOM树,RenderObject树,布局和绘制等。
- 当界面需要重绘(Repaint)或由于某种操作引发回流(reflow)时,该线程就会执行
- 注意,GUI渲染线程与JS引擎线程是互斥的,当JS引擎执行时GUI线程会被挂起(相当于被冻结了),GUI更新会被保存在一个队列中等到JS引擎空闲时立即被执行
-
JS引擎线程
- 也称为JS内核,负责处理Javascript脚本程序。(例如V8引擎)
- JS引擎线程负责解析Javascript脚本,运行代码
- JS引擎一直等待着任务队列中任务的到来,然后加以处理,一个Tab页(renderer进程)中无论什么时候都只有一个JS线程在运行JS程序
- 同样注意,GUI渲染线程与JS引擎线程是互斥的,所以如果JS执行的时间过长,这样就会造成页面的渲染不连贯,导致页面渲染加载阻塞。
-
事件触发线程
- 归属于浏览器而不是JS引擎,用来控制事件循环(可以理解,JS引擎自己都忙不过来,需要浏览器另开线程协助)
- 当JS引擎执行代码块如setTimeOut时(也可来自浏览器内核的其他线程,如鼠标点击、AJAX异步请求等),会将对应任务添加到事件线程中
- 当对应的事件符合触发条件被触发时,该线程会把事件添加到待处理队列的队尾,等待JS引擎的处理
- 注意,由于JS的单线程关系,所以这些待处理队列中的事件都得排队等待JS引擎处理(当JS引擎空闲时才会去执行)
-
定时触发器线程
- 传说中的setInterval与setTimeout所在线程
- 浏览器定时计数器并不是由JavaScript引擎计数的,(因为JavaScript引擎是单线程的, 如果处于阻塞线程状态就会影响记计时的准确)
- 因此通过单独线程来计时并触发定时(计时完毕后,添加到事件队列中,等待JS引擎空闲后执行)
- 注意,W3C在HTML标准中规定,规定要求setTimeout中低于4ms的时间间隔算为4ms。
-
异步http请求线程
- 在XMLHttpRequest在连接后是通过浏览器新开一个线程请求
将检测到状态变更时,如果设置有回调函数,异步线程就产生状态变更事件,将这个回调再放入事件队列中。再由JavaScript引擎执行。
- 在XMLHttpRequest在连接后是通过浏览器新开一个线程请求
浏览器内核中线程之间的关系
-
GUI渲染线程与JS引擎线程互斥
由于JavaScript是可操纵DOM的,如果在修改这些元素属性同时渲染界面(即JS线程和UI线程同时运行),那么渲染线程前后获得的元素数据就可能不一致了。
因此为了防止渲染出现不可预期的结果,浏览器设置GUI渲染线程与JS引擎为互斥的关系,当JS引擎执行时GUI线程会被挂起,
GUI更新则会被保存在一个队列中等到JS引擎线程空闲时立即被执行。 -
JS阻塞页面加载
从上述的互斥关系,可以推导出,JS如果执行时间过长就会阻塞页面。
譬如,假设JS引擎正在进行巨量的计算,此时就算GUI有更新,也会被保存到队列中,等待JS引擎空闲后执行。
然后,由于巨量计算,所以JS引擎很可能很久很久后才能空闲,自然会感觉到巨卡无比。
所以,要尽量避免JS执行时间过长,这样就会造成页面的渲染不连贯,导致页面渲染加载阻塞的感觉。 -
WebWorker,JS的多线程?
前文中有提到JS引擎是单线程的,而且JS执行时间过长会阻塞页面,那么JS就真的对cpu密集型计算无能为力么?
所以,后来HTML5中支持了Web Worker。MDN的官方解释是:
Web Worker为Web内容在后台线程中运行脚本提供了一种简单的方法。线程可以执行任务而不干扰用户界面
一个worker是使用一个构造函数创建的一个对象(e.g. Worker()) 运行一个命名的JavaScript文件
这个文件包含将在工作线程中运行的代码; workers 运行在另一个全局上下文中,不同于当前的window因此,使用 window快捷方式获取当前全局的范围 (而不是self) 在一个 Worker 内将返回错误,这样理解下:
创建Worker时,JS引擎向浏览器申请开一个子线程(子线程是浏览器开的,完全受主线程控制,而且不能操作DOM)
JS引擎线程与worker线程间通过特定的方式通信(postMessage API,需要通过序列化对象来与线程交互特定的数据)
所以,如果有非常耗时的工作,请单独开一个Worker线程,这样里面不管如何翻天覆地都不会影响JS引擎主线程,只待计算出结果后,将结果通信给主线程即可JS引擎是单线程的,这一点的本质仍然未改变,Worker可以理解是浏览器给JS引擎开的外挂,专门用来解决那些大量计算问题。
浏览器渲染流程
这里就简单梳理下浏览器渲染流程,我们就以输入url地址后说起:
- 当在地址栏中输入相应地址后,Browser进程(浏览器主进程)就接管了,它就会开一个下载线程;
- 然后进行 http请求(略去DNS查询,IP寻址等等操作),然后等待响应,获取内容
- 随后将内容通过RendererHost接口转交给Renderer进程(浏览器渲染进程)
- Render渲染进程的Renderer接口收到消息,简单解释后,交给GUI渲染引擎线程,然后开始渲染
- 具体的渲染机制大致分为以下步骤:
- 解析html建立dom树
- 解析css构建css样式规则树
- 将DOM树和css样式规则树合并成render树
- 布局render树(Layout/reflow),负责各元素尺寸、位置的计算
- 绘制render树(paint),绘制页面像素信息
- 浏览器会将各层的信息发送给GPU,GPU会将各层合成(composite),显示在屏幕上
- 当然可能会有JS引擎线程操作DOM(这可能会造成回流并重绘),或者用到其他线程(事件触发线程、定时器触发线程等)的一些操作
- 最后Render渲染进程将结果传递给Browser主进程
- Browser主进程接收到结果并将结果绘制出来
上述整个渲染过程示意图如下:
备注:本文中部分内容截取于https://www.pianshen.com/article/8466104268/文章