在PHP中正确使用引用符(&)可以提高程序运行效率,并且更加节约内存空间。但是在不理解引用原理的时候滥用引用符是极其危险的,往往会造成意料之外的错误。
1.变量的底层存储结构zval
PHP运行核心是Zend引擎,用纯C语言实现,是PHP的内核部分,它将PHP代码翻译(词法、语法解析等一系列编译过程)为可执行opcode的处理并实现相应的处理方法、实现了基本的数据结构(如hashtable、oo)、内存分配及管理、提供了相应的api方法供外部调用,是一切的核心,所有的外围功能均围绕Zend实现。(参见之前转载的 PHP的底层运行机制与原理)
zval是Zend引擎中的一个重要存储结构,作为变量真实的容器,用来标识并实现PHP变量。其数据结构如下:
一个zval变量容器,除了包含变量的类型和值,还包括两个字节的额外信息。第一个是”is_ref”,是个bool值,用来标识这个变量是否是属于引用集合。第二个额外字节是”refcount”,用以表示指向这个zval变量容器的变量个数,即引用计数。
利用 xdebug 可以查看变量的 is_ref 和 refcount 值。
2. 引用传值原理
Zend通过引用计数,多个变量可以共享同一份数据。避免频繁拷贝带来的大量消耗。
is_ref 记录是否引用赋值,(取值 false 或 1)。
refcount 记录zval被变量的引用次数,即引用计数。
在进行赋值操作时,zend将变量指向相同的zval同时ref_count++,在unset操作时,对应的ref_count-1。只有refcount减为0时才会真正执行销毁操作。如果是引用赋值,则zend会修改is_ref为1。
PHP变量通过引用计数实现变量共享数据,那如果改变其中一个变量值呢?当试图写入一个变量时,Zend若发现该变量指向的zval被多个变量共享,则为其复制一份refcount为1的zval,并递减原zval的refcount,这个过程称为“zval分离”。
当 is_ref为1 时,对指向zval的其中一个变量重新赋值,则直接改变zval的值,此时所有指向本zval的变量值都发生改变。
下面通过 xdebug 举几个案例:
(1)将变量值赋值给另一个变量,不会生成新的zval,而是在本zval的引用计数refcount + 1;
$a = 333;
xdebug_debug_zval('a');
$b = $a;
xdebug_debug_zval('a');
上例输出:
a:
(refcount=1, is_ref=0),int 333
a:
(refcount=2, is_ref=0),int 333
(2)使用引用传值赋值给另一个变量,不会生成新的zval,而是在本zval的引用计数refcount + 1,同时将is_ref改为1;
$a = 333;
xdebug_debug_zval('a');
$b = &$a;
xdebug_debug_zval('a');
上例输出:
a:
(refcount=1, is_ref=0),int 333
a:
(refcount=2, is_ref=1),int 333
(3)当试图写入一个变量时,Zend若发现该变量指向的zval被多个变量共享,则为其复制一份refcount为1的zval,并递减原zval的refcount,这个过程称为“zval分离”。
$a = 333;
xdebug_debug_zval('a');
$b = $a;
xdebug_debug_zval('a');
$b = 444;
xdebug_debug_zval('a');
xdebug_debug_zval('b');
上例输出:
a:
(refcount=1, is_ref=0),int 333
a:
(refcount=2, is_ref=0),int 333
a:
(refcount=1, is_ref=0),int 333
b:
(refcount=1, is_ref=0),int 444
(4)引用传值时,对指向zval的其中一个变量重新赋值,则直接改变zval的值,此时所有指向本zval的变量值都发生改变。
$a = 333;
xdebug_debug_zval('a');
$b = &$a;
xdebug_debug_zval('a');
$b = 444;
xdebug_debug_zval('a');
xdebug_debug_zval('b');
上例输出:
a:
(refcount=1, is_ref=0),int 333
a:
(refcount=2, is_ref=1),int 333
a:
(refcount=2, is_ref=1),int 444
b:
(refcount=2, is_ref=1),int 444
3.引用能做什么
(1)引用不存在的变量会自动创建该变量(默认值为null)。
function foo(&$var) { }
foo($a);
echo $a; // 输出null
$b = array();
foo($b['b']);
var_dump(array_key_exists('b', $b)); // bool(true)
$c = new StdClass;
foo($c->d);
var_dump(property_exists($c, 'd')); // bool(true)
(2)引用传递变量。
function foo(&$var)
{
$var++;
}
$a=5;
foo($a);
echo $a; //输出6