Zval是php底层解析引擎中一种非常重要的数据结构。
Php变量分三类:简单类型(int,string,bool),集合类型(array,resource,object),常量(const)。Php变量为弱类型,定义时不用指明数据类型,运行时可以隐式转换数据类型,也可进行显式数据类型转换。
Zval结构实现:
Zval主要由三部分组成:
1、 type:指定了变量所述的类型(整数、字符串、数组等)
2、 refcount & is_ref:用来实现引用计数(后面具体介绍)
3、 value:核心部分,存储了变量的实际数据
一、 zvalue
Zvalue是用来保存一个变量的实际数据。因为要存储多种类型,所以zvalue是一个union,也由此实现了弱类型。
union:
联合也是一种新的数据类型, 它是一种特殊形式的变量。
联合说明和联合变量定义与结构十分相似。其形式为:
union 联合名{
数据类型 成员名;
数据类型 成员名;
…
} 联合变量名;
联合表示几个变量公用一个内存位置, 在不同的时间保存不同的数据类型 和不同长度的变量。
二、 引用计数
引用计数在内存回收、字符串操作等地方使用非常广泛。
Zval的引用计数通过成员变量is_ref和ref_count实现,通过引用计数,多个变量可以共享同一份数据。避免频繁拷贝带来的大量消耗,在进行赋值操作时,zend将变量指向相同的zval同时ref_count++,在unset操作时,对应的ref_count-1。只有ref_count减为0时才会真正执行销毁操作。
如果是引用赋值,则zend会修改is_ref为1
三、 写时拷贝
Php变量通过引用计数实现变量共享数据,那如果改变其中一个变量值呢?
当试图写入一个变量时,Zend若发现该变量指向的zval被多个变量共享,则为其复制一份ref_count为1的zval,并递减原zval的refcount,这个过程称为“zval分离”。可见,只有在有写操作发生时zend才进行拷贝操作,因此也叫copy-on-write(写时拷贝)。
对于引用型变量,其要求和非引用型相反,引用赋值的变量间必须是捆绑的,修改一个变量就修改了所有捆绑变量。
其他相关:
1、内存泄漏也称作“存储渗漏”,用动态存储分配函数动态开辟的空间,在使用完毕后未释放,结果导致一直占据该内存单元。直到程序结束。即所谓内存泄漏。百度百科
2、在5.2及更早版本的PHP中,没有专门的垃圾回收器GC(Garbage Collection),引擎在判断一个变量空间是否能够被释放的时候是依据这个变量的zval的refcount的值,如果refcount为0,那么 变量的空间可以被释放,否则就不释放,这是一种非常简单的GC实现。然而在这种简单的GC实现方案中,出现了意想不到的变量内存泄漏情况(Bug:http://bugs.php.net/bug.php?id=33595), 引擎将无法回收这些内存,于是在PHP5.3中出现了新的GC,新的GC有专门的机制负责清理垃圾数据,防止内存泄漏。