PHP中的变量是弱类型的,这一点大家都知道,实现弱类型的方式使用的一个联合体来表示的,实际的源代码如下:
typedef union _zvalue_value {
long lval; /* long value */
double dval; /* double value */
struct {
char *val;
int len;
} str;
HashTable *ht; /* hash table value */
zend_object_value obj;
} zvalue_value;
其中 long lval 对应PHP中的整型、长整型、布尔值等
double dval 对应PHP中的浮点型
struct str 对应PHP中的字符串,可以看到字符串是用的一个结构体表示,一个指向字符串的指针(char *val)和一个存储字符串长度的整型(int len),因此在PHP中获取字符串的长度实际上是直接返回的len的值
HashTable *ht 对应PHP中的数组
zend_object_value obj 对应PHP中的对象。
现在就剩下一个PHP中的资源类型没有与之对应的变量了,其实在PHP中如果变量是资源类型,则会访问这个上面联合体的long lval值,这里存储一个整型数值,然后PHP根据这个整型的值再去访问资源列表,所以的资源类型都保存在一个资源表里面,而这个lval只是保存了其在资源表中的偏移量。
接下来的问题是PHP是如何知道当前变量的类型的呢?只有知道了变量的类型才可以知道如何来访问上面的联合体。在PHP源码中可以找到下面的一个结构体,所有的变量在PHP中实际上都是下面这个结构体类型的:
struct _zval_struct {
/* Variable information */
zvalue_value value; /* value */
zend_uint refcount__gc; /*引用计数*/
zend_uchar type; /* active type */
zend_uchar is_ref__gc; /*是否为引用*/
};
其中zvalue_value value就是最开始提到的那个联合体,保存了变量的实际值。
zend_uchar type 这个变量里面保存的当前正在使用的变量的类型(字符串、整型、数组等)
剩下的两个结构体成员就是PHP中非常高明的地方了,PHP采用写时复制的方式来控制内存的使用和提高效率,也就是说当将一个变量赋值给另一个变量时,实际上并没有完整的复制个变量然后赋值,而只是简单的指向原变量的引用地址。例如下面的示例:
<?php
$a = 'new string';
$b = $a;
在上面的两句代码中,实际上只存在一个zval结构体,也就是在创建$a时创建了zval结构体,而在将$a赋值给$b时,实际上只是简单将$b指向$a所表示的zval结构体,要明白zend_uint refcount__gc;和zend_uchar is_ref__gc;这两个结构体成员在这里所担任的角色,可以使用下面的代码来理解:
<?php
$a = 'new string';
xdebug_debug_zval('a');
$b = $a;
xdebug_debug_zval('a');
$b = 'test';
xdebug_debug_zval('a');
$c = &$a;
xdebug_debug_zval('a');
如果安装了xdebug那么上面的代码将输出如下:
a: (refcount=1, is_ref=0)='new string'
a: (refcount=2, is_ref=0)='new string'
a: (refcount=1, is_ref=0)='new string'
a: (refcount=2, is_ref=1)='new string'
可以看出当产生一次赋值时,recount会加一,如果赋值后的变量发生改变,那么就会创建一个新的zval,同时原来的zval的recount值减一,当recount的值为0后,那么这个zval将会被销毁,当显式的使用&符号引用变量地址时is_ref的值就会变为true;这就是写时复制的概念。
这里只是我查看PHP手册时的简单理解,想起信息参考:
http://www.php.net/manual/zh/features.gc.refcounting-basics.php