php垃圾回收装置,大白话 PHP 的「垃圾回收」原理

本文深入探讨了PHP的垃圾回收机制,不同于Java的可达性分析算法,PHP使用引用计数算法。当引用计数为0时,变量会被释放。然而,引用计数法在处理循环引用时面临挑战,PHP通过特定的垃圾鉴定程序解决这一问题。文章详细阐述了PHP的垃圾回收过程,包括何时回收、如何鉴定和释放垃圾,并介绍了相关源码。同时,提到了PHP在解决循环引用上的独特算法,以及垃圾回收中的四种关键颜色:灰色、白色、黑色和紫色。
摘要由CSDN通过智能技术生成

我天,PHP 的垃圾回收可太秀了!

Java 种的垃圾回收机制,大家肯定都有所了解,比如如何确定垃圾,有两种算法,引用计数法和可达性分析算法。

Java 中使用的是可达性分析算法,而 PHP 使用的引用计数算法。

我们都知道引用计数算法较难处理循环引用的问题,PHP 这波奇怪的操作可太秀了。

那 PHP 的垃圾回收原理是怎么样的?

一、PHP 中的引用计数

1.1 如何确定垃圾

原理: 给对象添加一个引用计数器,每当有一个地方引用它,计数器的值就加一。每当有一个引用失效,计数器的值就减一。

如果一个变量 value 的 refcount 减一之后等于 0,此 value 可以被释放掉,不属于垃圾。垃圾回收器不会处理 。

如果一个变量 value 的 refcount 减一之后还是大于 0,此 value 被认为不能被释放掉,可能成为一个垃圾。

垃圾回收器将可能的垃圾收集起来,等达到一定数量后开始启动垃圾鉴定程序,把真正的垃圾释放掉。

缺点: 需要维护引用计数器,有一定的消耗。且较难处理循环引用的问题。后面也会讲到如何解决这个问题。

下面的例子说明引用计数的是如何变化的:

0fd889d3b277553375551b71f1e91c8c.png

1.2 PHP 中的变量知识

每个 php 变量存在一个叫 zval 的变量容器中。一个 zval 变量容器,除了包含变量的类型和值,还包括两个字节的额外信息。

第一个是 is_ref,是个 bool 值,用来标识这个变量是否是属于引用集合(reference set) 。通过这个字节,php 引擎才能把普通变量和引用变量区分开来,由于 php 允许用户通过使用&来使用自定义引用,zval 变量容器中还有一个内部引用计数机制,来优化内存使用。

第二个额外字节是 refcount,用以表示指向这个 zval 变量容器的变量(也称符号即 symbol )个数。

1.3 使用引用计数的类型

有 5 种类型用的引用计数:

string、array、object、resource、reference

下面的表格说明了只有 type_flag 为以下 8 种类型且 IS_TYPE_REFOUNTED=true 的变量才使用引用计数,如下表所示

c36095c5c39f9bc7f732180fce532c30.png

二、回收原理

2.1. 回收时机

自动回收:在变量 zval 断开 value 的指向时,如果发现 refcount=0 则会直接释放 value。

断开 value 指向的情形

修改变量时会断开原有 value 的指向

函数返回时会释放所有的局部变量

主动回收

调用 unset() 函数。类似于 Java 中的 System.gc()

2.2 垃圾鉴定

垃圾收集器收集的可能垃圾到达一定数量后,启动垃圾鉴定、回收程序。

原理:垃圾是由于成员引用自身导致的,那么就对 value 的 refcount 减一操作,如果 value 的 refount 变为了 0,则表明其引用全部来自自身成员,value 属于垃圾。另外垃圾只会出现在array、object类型中。

893a8bb1d02fd347deb6cf08aa554e66.png

步骤一: 遍历垃圾回收器的 buffer 缓冲区,把 value 标为灰色,把 value 的成员的 refount-1,还是标为灰色。

步骤二: 遍历垃圾回收器的 buffer 缓冲区,如果 value 的 refcount 等于 0,标为白色,认为是垃圾;如果不等于 0,则表示还有外部的引用,不是垃圾,将 refcount+1 还原回去,标为黑色。

步骤三: 遍历垃圾回收器的 buffer 缓冲区,将 value 为非白色的节点从 buffer 中删除,最终 buffer 缓冲区中都是真正的垃圾。

步骤四: 遍历垃圾回收器的 buffer 缓冲区,释放此 value。

三、带你看源码

1. 垃圾管家

我称 _zend_gc_globals 为垃圾管家,结构体会对垃圾进行管理,收集到的可能成为垃圾的 value 就保存在这个结构的 buf 中,称为垃圾缓存区。

文件路径:\Zend\zend_gc.h。

3239e97dbbb48187ee160f94244aa339.png

2. 垃圾管家初始化

(1)php.ini 解析后调用 gc_init() 初始垃圾管家_zend_gc_globals

文件路径:\Zend\zend_gc.c

63ffc2b529d5def510178d0cfc898a80.png

(2)gc_init() 函数里面调用 gc_reset() 函数初始化。

21bfa69ba34db1ab5cbb20809117d3ac.png

3. 判断是否需要收集

(1)在销毁一个变量时就会判断是否需要收集。调用 i_zval_ptr_dtor() 函数

​ 文件路径:Zend\zend_variables.h

dbc91f17ea5c660a2cc27a7b5b09f02f.png

如果 refcount 减一后,refcount 等于 0,则认为不是垃圾,调用 _zval_dtor_func 方法释放此 value。

如果 refcount 减一后,refcount 大于 0,则认为 value 可能是垃圾,垃圾管家进行收集

3. 收集垃圾

文件路径:\Zend\zend_gc.c,调用方法:gc_possible_root

11ec00f8665c34507a2d2de166a790b4.png

拿出 unused 指向的节点。

如果拿出的节点是可用的,则将 unused 指向下一个节点。

如果 unused 没有可用的,且 first_unused 还没有推进到 last_unused,则表示 buf 缓存区中还有可用的节点。

拿出 first_unused 指向的节点。

first_unused 指向下一个节点。

buf 缓存区已满,启动垃圾鉴定、垃圾回收。

如果未启用垃圾回收,则直接返回。

a8962a688c3d59bde44f891eb9de0a8c.png

将插入的变量标为紫色,防止重复插入。

将该节点在 buf 数组中的位置保存到了 gc_info 中,当后续 value 的 refcount 变为了 0。

需要将其从 buf 中删除时可以知道该 value 保存在哪个 gc_root_buffer 中。

5. 释放垃圾

由于回收方法 zend_gc_collect_cycles() 实在是太长,我把几个关键步骤理出来了:

599792fe9fb42fa3e39292cf7a9d5114.png

扫描根节点

收集根节点

调用回收器

清理变量

收集完成

四、总结

(1)PHP 的垃圾回收和 Java 的垃圾回收还是很有很大区别的,我们都以为没有高级语言会用到引用计数法来回收垃圾,但偏偏 PHP 用的是引用计数。

(2)PHP 用了一套自己的算法来解决因循环引用而产生垃圾的问题,这套算法可以简单理解为先把可疑垃圾的引用计数减一来进行测试,如果引用计数确实等于 0 ,则标记颜色为黑色,后续一起清理。

(3)PHP 垃圾收集中总共用到了四种关键颜色:灰色-缓冲区可疑垃圾,白色- 垃圾,黑色- 非垃圾,紫色- 防止重复插入。

那PHP 到底是不是最好的语言?欢迎留言区讨论!

END -

我是悟空,努力变强,变身超级赛亚人!手写了一套 Spring Cloud 进阶教程和 PMP 刷题小程序。

欢迎关注公众号:悟空聊架构

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值