每个php变量存在一个叫"zval"的变量容器中。一个zval变量容器,除了包含变量的类型和值,还包括两个字节的额外信息。第一个是"is_ref",是个bool值,用来标识这个变量是否是属于引用集合(reference set)。通过这个字节,php引擎才能把普通变量和引用变量区分开来,由于php允许用户通过使用&来使用自定义引用,zval变量容器中还有一个内部引用计数机制,来优化内存使用。第二个额外字节是"refcount",用以表示指向这个zval变量容器的变量(也称符号即symbol)个数。
在PHP5.3之前的回收机制是引用计数就是当zval的某一个变量的refcount(引用次数)等于0执行回收
PHP的引用方式是环形引用如:
//$a和$b公用一个zval空间实现内存共享
$a='张三';
$b=&$a;//$a与$b的refcount(引用次数)就为2
当 b 的 变 量 发 生 改 变 的 时 候 才 会 为 b的变量发生改变的时候才会为 b的变量发生改变的时候才会为b开辟一个新空间当然,$a的引用次数也会减一。
这种回收机制处理普通数据类型是没有问题的,但是当处理复合数据类型(数组、对象)的时候,环形引用就会产生内存泄漏如:
$a = array( 'meaning' => 'life', 'number' => 42 );
$a['life'] = $a['meaning'];
xdebug_debug_zval( 'a' );
a: (refcount=1, is_ref=0)=array (
'meaning' => (refcount=2, is_ref=0)='life',
'number' => (refcount=1, is_ref=0)=42,
'life' => (refcount=2, is_ref=0)='life'
)
这时候你会发现因为当前数组的子元素引用了父级数据的某个值,当前数组的某些子元素的引用次数变成了2,如果我unset销毁$a数组的时候当前数组减一为0可以被回收,但是因为此数组的子元素减一不为0,那么这个变量就无法被销毁,在php中无法使用,但是没有在zval内存中被回收,那么就产生了内存泄漏。
在PHP5.3之后就更新了垃圾回收,也就是GC算法。
此算法机制大致如下:
①如果zval的某个变量的引用次数正在增加说明正在被使用,就不是垃圾。
②如果zval的某个变量的引用次数等于0说明已经被回收,就不是垃圾。
③如果zval的某个变量的引用次数减少却大于0说明改变量无法被销毁,就是垃圾。
PHP就会把满足第三种条件的变量放进缓冲区,等达到配置中的值的时候(默认是1000),对里面的所有数据进行减一操作如等于0就被回收,不等于0说明改变量正在使用那么就从新把它的引用次数加一。