如何编写PHP扩展

最新推荐文章于 2024-10-18 14:55:22 发布

分懂课堂

最新推荐文章于 2024-10-18 14:55:22 发布

阅读量495

点赞数

分类专栏： PHP 文章标签： php zend 扩展 parameters file function

PHP 专栏收录该内容

40 篇文章 0 订阅

订阅专栏

如何编写 PHP 扩展

翻译： taft@wjl.cn

Ver 0.1

最后修改日期 2006/1/19

WJL Studio @ wjl.cn 2006

目录

简介 .... 3

快速开始 .... 3

内存管理 .... 7

从 PHP 函数中返回值 .... 7

完成 self_concat() 8

实例小结 .... 9

包裹第三方的扩展 .... 9

编写利用资源的第一个 PHP 函数 .... 12

全局变量 .... 16

添加自定义 INI 指令 .... 17

线程安全资源管理宏 .... 18

总结 .... 19

词汇表 .... 19

简介

PHP 取得成功的一个主要原因之一是她拥有大量的可用扩展。 web 开发者无论有何种需求，这种需求最有可能在 PHP 发行包里找到。 PHP 发行包包括支持各种数据库，图形文件格式，压缩， XML 技术扩展在内的许多扩展。

扩展 API 的引入使 PHP3 取得了巨大的进展，扩展 API 机制使 PHP 开发社区很容易的开发出几十种扩展。现在，两个版本过去了， API 仍然和 PHP3 时的非常相似。扩展主要的思想是：尽可能的从扩展编写者那里隐藏 PHP 的内部机制和脚本引擎本身，仅仅需要开发者熟悉 API 。

有两个理由需要自己编写 PHP 扩展。第一个理由是： PHP 需要支持一项她还未支持的技术。这通常包括包裹一些现成的 C 函数库，以便提供 PHP 接口。例如，如果一个叫 FooBase 的数据库已推出市场，你需要建立一个 PHP 扩展帮助你从 PHP 里调用 FooBase 的 C 函数库。这个工作可能仅由一个人完成，然后被整个 PHP 社区共享（如果你愿意的话）。第二个不是很普遍的理由是：你需要从性能或功能的原因考虑来编写一些商业逻辑。

如果以上的两个理由都和你没什么关系，同时你感觉自己没有冒险精神，那么你可以跳过本章。

本章教你如何编写相对简单的 PHP 扩展，使用一部分扩展 API 函数。对于大多数打算开发自定义 PHP 扩展开发者而言，它含概了足够的资料。学习一门编程课程的最好方法之一就是动手做一些极其简单的例子，这些例子正是本章的线索。一旦你明白了基础的东西，你就可以在互联网上通过阅读文挡、原代码或参加邮件列表新闻组讨论来丰富自己。因此，本章集中在让你如何开始的话题。在 UNIX 下一个叫 ext_skel 的脚本被用于建立扩展的骨架，骨架信息从一个描述扩展接口的定义文件中取得。因此你需要利用 UNIX 来建立一个骨架。 Windows 开发者可以使用 Windows ext_skel_win32.php 代替 ext_skel 。

然而，本章关于用你开发的扩展编译 PHP 的指导仅涉及 UNIX 编译系统。本章中所有的对 API 的解释与 UNIX 和 Windows 下开发的扩展都有联系。

当你阅读完这章，你能学会如何

☞ 建立一个简单的商业逻辑扩展。

☞ . 建议个 C 函数库的包裹扩展，尤其是有些标准 C 文件操作函数比如 fopen()

快速开始

本节没有介绍关于脚本引擎基本构造的一些知识，而是直接进入扩展的编码讲解中，因此不要担心你无法立刻获得对扩展整体把握的感觉。假设你正在开发一个网站，需要一个把字符串重复 n 次的函数。下面是用 PHP 写的例子：

function self_concat($string, $n)

{

$result = "";

for ($i = 0; $i < $n; $i++) {

$result .= $string;

}

return $result;

}

self_concat("One", 3) returns "OneOneOne".

self_concat("One", 1) returns "One".

假设由于一些奇怪的原因，你需要时常调用这个函数，而且还要传给函数很长的字符串和大值 n 。这意味着在脚本里有相当巨大的字符串连接量和内存重新分配过程，以至显著地降低脚本执行速度。如果有一个函数能够更快地分配大量且足够的内存来存放结果字符串，然后把 $string 重复 n 次，就不需要在每次循环迭代中分配内存。

为扩展建立函数的第一步是写一个函数定义文件，该函数定义文件定义了扩展对外提供的函数原形。该例中，定义函数只有一行函数原形 self_concat() :

string self_concat(string str, int n)

函数定义文件的一般格式是一个函数一行。你可以定义可选参数和使用大量的 PHP 类型，包括 : bool, float, int, array 等。

保存为 myfunctions.def 文件至 PHP 原代码目录树下。

该是通过扩展骨架 (skeleton) 构造器运行函数定义文件的时机了。该构造器脚本叫 ext_skel ，放在 PHP 原代码目录树的 ext/ 目录下（ PHP 原码主目录下的 README.EXT_SKEL 提供了更多的信息）。假设你把函数定义保存在一个叫做 myfunctions.def 的文件里，而且你希望把扩展取名为 myfunctions ，运行下面的命令来建立扩展骨架

./ext_skel --extname=myfunctions --proto=myfunctions.def

这个命令在 ext/ 目录下建立了一个 myfunctions/ 目录。你要做的第一件事情也许就是编译该骨架，以便编写和测试实际的 C 代码。编译扩展有两种方法：

☞ 作为一个可装载模块或者 DSO （动态共享对象）

☞ 静态编译到 PHP

因为第二种方法比较容易上手，所以本章采用静态编译。如果你对编译可装载扩展模块感兴趣，可以阅读 PHP 原代码根目录下的 README.SELF-CONTAINED_EXTENSIONS 文件。为了使扩展能够被编译，需要修改扩展目录 ext/myfunctions/ 下的 config.m4 文件。扩展没有包裹任何外部的 C 库，你需要添加支持 --enable-myfunctions 配置开关到 PHP 编译系统里（– with-extension 开关用于那些需要用户指定相关 C 库路径的扩展）。可以去掉自动生成的下面两行的注释来开启这个配置。

PHP_ARG_ENABLE(myfunctions, whether to enable myfunctions support,

[ --enable-myfunctions Include myfunctions support])

现在剩下的事情就是在 PHP 原代码树根目录下运行 ./buildconf ，该命令会生成一个新的配置脚本。通过查看 ./configure --help 输出信息，可以检查新的配置选项是否被包含到配置文件中。现在，打开你喜好的配置选项开关和 --enable-myfunctions 重新配置一下 PHP 。最后的但不是最次要的是，用 make 来重新编译 PHP 。

ext_skel 应该把两个 PHP 函数添加到你的扩展骨架了：打算实现的 self_concat() 函数和用于检测 myfunctions 是否编译到 PHP 的 confirm_myfunctions_compiled() 函数。完成 PHP 的扩展开发后，可以把后者去掉。

<?php

print confirm_myfunctions_compiled("myextension");

运行这个脚本会出现类似下面的输出：

"Congratulations! You have successfully modified ext/myfunctions

config.m4. Module myfunctions is now compiled into PHP."

另外， ext_skel 脚本生成一个叫 myfunctions.php 的脚本，你也可以利用它来验证扩展是否被成功地编译到 PHP 。它会列出该扩展所支持的所有函数。

现在你学会如何编译扩展了，该是真正地研究 self_concat() 函数的时候了。

下面就是 ext_skel 脚本生成的骨架结构：

/* {{{ proto string self_concat(string str, int n)

PHP_FUNCTION(self_concat)

}

char *str = NULL;

int argc = ZEND_NUM_ARGS();

int str_len;

long n;

if (zend_parse_parameters(argc TSRMLS_CC, "sl", &str, &str_len, &n) == FAILURE)

return;

php_error(E_WARNING, "self_concat: not yet implemented");

}

/* }}} */

自动生成的 PHP 函数周围包含了一些注释，这些注释用于自动生成代码文档和 vi 、 Emacs 等编辑器的代码折叠。函数自身的定义使用了宏 PHP_FUNCTION() ，该宏可以生成一个适合于 Zend 引擎的函数原型。逻辑本身分成语义各部分，取得调用函数的参数和逻辑本身。

为了获得函数传递的参数，可以使用 zend_parse_parameters()API 函数。下面是该函数的原型：

zend_parse_parameters(int num_args TSRMLS_DC, char *type_spec, … );

第一个参数是传递给函数的参数个数。通常的做法是传给它 ZEND_NUM_ARGS() 。这是一个表示传递给函数参数总个数的宏。第二个参数是为了线程安全，总是传递 TSRMLS_CC 宏，后面会讲到。第三个参数是一个字符串，指定了函数期望的参数类型，后面紧跟着需要随参数值更新的变量列表。因为 PHP 采用松散的变量定义和动态的类型判断，这样做就使得把不同类型的参数转化为期望的类型成为可能。例如，如果用户传递一个整数变量，可函数需要一个浮点数，那么 zend_parse_parameters() 就会自动地把整数转换为相应的浮点数。如果实际值无法转换成期望类型（比如整形到数组形），会触发一个警告。

下表列出了可能指定的类型。我们从完整性考虑也列出了一些没有讨论到的类型。

类型指定符	对应的 C 类型	描述
l	long	符号整数
d	double	浮点数
s	char *, int	二进制字符串，长度
b	zend_bool	逻辑型（ 1 或 0 ）
r	zval *	资源（文件指针，数据库连接等）
a	zval *	联合数组
o	zval *	任何类型的对象
O	zval *	指定类型的对象。需要提供目标对象的类类型
z	zval *	无任何操作的 zval

为了容易地理解最后几个选项的含义，你需要知道 zval 是 Zend 引擎的值容器 [1] 。无论这个变量是布尔型，字符串型或者其他任何类型，其信息总会包含在一个 zval 联合体中。本章中我们不直接存取 zval ，而是通过一些附加的宏来操作。下面的是或多或少在 C 中的 zval, 以便我们能更好地理解接下来的代码。

typedef union _zval {

long lval;

double dval;

struct {

char *val;

int len;

} str;

HashTable *ht;

zend_object_value obj;

} zval;

在我们的例子中，我们用基本类型调用 zend_parse_parameters() ，以本地 C 类型的方式取得函数参数的值，而不是用 zval 容器。

为了让 zend_parse_parameters() 能够改变传递给它的参数的值，并返回这个改变值，需要传递一个引用。仔细查看一下 self_concat() ：

if (zend_parse_parameters(argc TSRMLS_CC, "sl", &str, &str_len, &n) == FAILURE)

return;

注意到自动生成的代码会检测函数的返回值 FAILUER( 成功即 SUCCESS) 来判断是否成功。如果没有成功则立即返回，并且由 zend_parse_parameters() 负责触发警告信息。因为函数打算接收一个字符串 l 和一个整数 n ，所以指定 ”sl” 作为其类型指示符。 s 需要两个参数，所以我们传递参考 char * 和 int (str 和 str_len) 给 zend_parse_parameters() 函数。无论什么时候，记得总是在代码中使用字符串长度 str_len 来确保函数工作在二进制安全的环境中。不要使用 strlen() 和 strcpy() ，除非你不介意函数在二进制字符串下不能工作。二进制字符串是包含有 nulls 的字符串。二进制格式包括图象文件，压缩文件，可执行文件和更多的其他文件。 ”l” 只需要一个参数，所以我们传递给它 n 的引用。尽管为了清晰起见，骨架脚本生成的 C 变量名与在函数原型定义文件中的参数名一样；这样做不是必须的，尽管在实践中鼓励这样做。

回到转换规则中来。下面三个对 self_concat() 函数的调用使 str, str_len 和 n 得到同样的值：

self_concat("321", 5);

self_concat(321, "5");

self_concat("321", "5");

str points to the string "321", str_len equals 3, and n equals 5.

str 指向字符串 "321" ， str_len 等于 3 ， n 等于 5 。

在我们编写代码来实现连接字符串返回给 PHP 的函数前，还得谈谈两个重要的话题：内存管理、从 PHP 内部返回函数值所使用的 API 。

内存管理

用于从堆中分配内存的 PHP API 几乎和标准 C API 一样。在编写扩展的时候，使用下面与 C 对应（因此不必再解释）的 API 函数：

emalloc(size_t size);

efree(void *ptr);

ecalloc(size_t nmemb, size_t size);

erealloc(void *ptr, size_t size);

estrdup(const char *s);

estrndup(const char *s, unsigned int length);

在这一点上，任何一位有经验的 C 程序员应该象这样思考一下：“什么？标准 C 没有 strndup() ？”是的，这是正确的，因为 GNU 扩展通常在 Linux 下可用。 estrndup() 只是 PHP 下的一个特殊函数。它的行为与 estrdup() 相似，但是可以指定字符串重复的次数（不需要结束空字符），同时是二进制安全的。这是推荐使用 estrndup() 而不是 estrdup() 的原因。

在几乎所有的情况下，你应该使用这些内存分配函数。有一些情况，即扩展需要分配在请求中永久存在的内存，从而不得不使用 malloc() ，但是除非你知道你在做什么，你应该始终使用以上的函数。如果没有使用这些内存函数，而相反使用标准 C 函数分配的内存返回给脚本引擎，那么 PHP 会崩溃。

这些函数的优点是：任何分配的内存在偶然情况下如果没有被释放，则会在页面请求的最后被释放。因此，真正的内存泄漏不会产生。然而，不要依赖这一机制，从调试和性能两个原因来考虑，应当确保释放应该释放的内存。剩下的优点是在多线程环境下性能的提高，调试模式下检测内存错误等。

还有一个重要的原因，你不需要检查这些内存分配函数的返回值是否为 null 。当内存分配失败，它们会发出 E_ERROR 错误，从而决不会返回到扩展。

从 PHP 函数中返回值

扩展 API 包含丰富的用于从函数中返回值的宏。这些宏有两种主要风格：第一种是 RETVAL_type() 形式，它设置了返回值但 C 代码继续执行。这通常使用在把控制交给脚本引擎前还希望做的一些清理工作的时候使用，然后再使用 C 的返回声明 ”return” 返回到 PHP ；后一个宏更加普遍，其形式是 RETURN_type() ，他设置了返回类型，同时返回控制到 PHP 。下表解释了大多数存在的宏。

设置返回值并且结束函数	设置返回值	宏返回类型和参数
RETURN_LONG(l)	RETVAL_LONG(l)	整数
RETURN_BOOL(b)	RETVAL_BOOL(b)	布尔数 (1 或 0)
RETURN_NULL()	RETVAL_NULL()	NULL
RETURN_DOUBLE(d)	RETVAL_DOUBLE(d)	浮点数
RETURN_STRING(s, dup)	RETVAL_STRING(s, dup)	字符串。如果 dup 为 1 ，引擎会调用 estrdup() 重复 s ，使用拷贝。如果 dup 为 0 ，就使用 s
RETURN_STRINGL(s, l, dup)	RETVAL_STRINGL(s, l, dup)	长度为 l 的字符串值。与上一个宏一样，但因为 s 的长度被指定，所以速度更快。
RETURN_TRUE	RETVAL_TRUE	返回布尔值 true 。注意到这个宏没有括号。
RETURN_FALSE	RETVAL_FALSE	返回布尔值 false 。注意到这个宏没有括号。
RETURN_RESOURCE(r)	RETVAL_RESOURCE(r)	资源句柄。

完成 self_concat()

现在你已经学会了如何分配内存和从 PHP 扩展函数里返回函数值，那么我们就能够完成 self_concat() 的编码：

/* {{{ proto string self_concat(string str, int n)

PHP_FUNCTION(self_concat)

}

char *str = NULL;

int argc = ZEND_NUM_ARGS();

int str_len;

long n;

char *result; /* Points to resulting string */

char *ptr; /* Points at the next location we want to copy to */

int result_length; /* Length of resulting string */

if (zend_parse_parameters(argc TSRMLS_CC, "sl", &str, &str_len, &n) == FAILURE)

return;

/* Calculate length of result */

result_length = (str_len * n);

/* Allocate memory for result */

result = (char *) emalloc(result_length + 1);

/* Point at the beginning of the result */

ptr = result;

while (n--) {

/* Copy str to the result */

memcpy(ptr, str, str_len);

/* Increment ptr to point at the next position we want to write to */

ptr += str_len;

}

/* Null terminate the result. Always null-terminate your strings

even if they are binary strings */

*ptr = '/0';

/* Return result to the scripting engine without duplicating it*/

RETURN_STRINGL(result, result_length, 0);

}

/* }}} */

现在要做的就是重新编译一下 PHP ，这样就完成了第一个 PHP 函数。

让我门检查函数是否真的工作。在最新编译过的 PHP 树下执行 [2] 下面的脚本：

<?php

for ($i = 1; $i <= 3; $i++) {

print self_concat("ThisIsUseless", $i);

print "/n";

}

你应该得到下面的结果：

ThisIsUseless

ThisIsUselessThisIsUseless

ThisIsUselessThisIsUselessThisIsUseless

实例小结

你已经学会如何编写一个简单的 PHP 函数。回到本章的开头，我们提到用 C 编写 PHP 功能函数的两个主要的动机。第一个动机是用 C 实现一些算法来提高性能和扩展功能。前一个例子应该能够指导你快速上手这种类型扩展的开发。第二个动机是包裹三方函数库。我们将在下一步讨论。

包裹第三方的扩展

本节中你将学到如何编写更有用和更完善的扩展。该节的扩展包裹了一个 C 库，展示了如何编写一个含有多个互相依赖的 PHP 函数扩展。

动机也许最常见的 PHP 扩展是那些包裹第三方 C 库的扩展。这些扩展包括 MySQL 或 Oracle 的数据库服务库， libxml2 的 XML 技术库， ImageMagick 或 GD 的图形操纵库。

在本节中，我们编写一个扩展，同样使用脚本来生成骨架扩展，因为这能节省许多工作量。这个扩展包裹了标准 C 函数 fopen(), fclose(), fread(), fwrite() 和 feof().

扩展使用一个被叫做资源的抽象数据类型，用于代表已打开的文件 FILE* 。你会注意到大多数处理比如数据库连接、文件句柄等的 PHP 扩展使用了资源类型，这是因为引擎自己无法直接“理解”它们。我们计划在 PHP 扩展中实现的 C API 列表如下：

FILE *fopen(const char *path, const char *mode);

int fclose(FILE *stream);

size_t fread(void *ptr, size_t size, size_t nmemb, FILE *stream);

size_t fwrite(const void *ptr, size_t size, size_t nmemb, FILE *stream);

int feof(FILE *stream);

我们实现这些函数，使它们在命名习惯和简单性上符合 PHP 脚本。如果你曾经向 PHP 社区贡献过代码，你被期望遵循一些公共习俗，而不是跟随 C 库里的 API 。并不是所有的习俗都写在 PHP 代码树的 CODING_STANDARDS 文件里。这即是说，此功能已经从 PHP 发展的很早阶段即被包含在 PHP 中，并且与 C 库 API 类似。 PHP 安装已经支持 fopen(), fclose() 和更多的 PHP 函数。

以下是 PHP 风格的 API ：

resource file_open(string filename, string mode)

file_open() 接收两个字符串（文件名和模式），返回一个文件的资源句柄。

bool file_close(resource filehandle)

file_close() 接收一个资源句柄，返回真 / 假指示是否操作成功。

string file_read(resource filehandle, int size)

file_read() 接收一个资源句柄和读入的总字节数，返回读入的字符串。

bool file_write(resource filehandle, string buffer)

file_write 接收一个资源句柄和被写入的字符串，返回真 / 假指示是否操作成功。

bool file_eof(resource filehandle)

file_eof() 接收一个资源句柄，返回真 / 假指示是否到达文件的尾部。

因此，我们的函数定义文件 —— 保存为 ext/ 目录下的 myfile.def ——内容如下：

resource file_open(string filename, string mode)

bool file_close(resource filehandle)

string file_read(resource filehandle, int size)

bool file_write(resource filehandle, string buffer)

bool file_eof(resource filehandle)

下一步，利用 ext_skel 脚本在 ext./ 原代码目录执行下面的命令：

./ext_skel --extname=myfile --proto=myfile.def

然后，按照前一个例子的关于编译新建立脚本的步骤操作。你会得到一些包含 FETCH_RESOURCE() 宏行的编译错误，这样骨架脚本就无法顺利完成编译。为了让骨架扩展顺利通过编译，把那些出错行 [3] 注释掉即可。

资源资源是一个能容纳任何信息的抽象数据结构。正如前面提到的，这个信息通常包括例如文件句柄、数据库连接结构和其他一些复杂类型的数据。

使用资源的主要原因是因为：资源被一个集中的队列所管理，该队列可以在 PHP 开发人员没有在脚本里面显式地释放时可以自动地被释放。

举个例子，考虑到编写一个脚本，在脚本里调用 mysql_connect() 打开一个 MySQL 连接，可是当该数据库连接资源不再使用时却没有调用 mysql_close() 。在 PHP 里，资源机制能够检测什么时候这个资源应当被释放，然后在当前请求的结尾或通常情况下更早地释放资源。这就为减少内存泄漏赋予了一个“防弹”机制。如果没有这样一个机制，经过几次 web 请求后， web 服务器也许会潜在地泄漏许多内存资源，从而导致服务器当机或出错。

注册资源类型 如何使用资源？ Zend 引擎让使用资源变地非常容易。你要做的第一件事就是把资源注册到引擎中去。使用这个 API 函数：

int zend_register_list_destructors_ex(rsrc_dtor_func_t ld, rsrc_dtor_func_t pld, char *type_name, int module_number)

这个函数返回一个资源类型 id ，该 id 应当被作为全局变量保存在扩展里，以便在必要的时候传递给其他资源 API 。 ld ：该资源释放时调用的函数。 pld 用于在不同请求中始终存在的永久资源，本章不会涉及。 type_name 是一个具有描述性类型名称的字符串， module_number 为引擎内部使用，当我们调用这个函数时，我们只需要传递一个已经定义好的 module_number 变量。

回到我们的例子中来：我们会添加下面的代码到 myfile.c 原文件中。该文件包括了资源释放函数的定义，此资源函数被传递给 zend_register_list_destructors_ex() 注册函数（资源释放函数应该提早添加到文件中，以便在调用 zend_register_list_destructors_ex() 时该函数已被定义）：

static void myfile_dtor(zend_rsrc_list_entry *rsrc TSRMLS_DC)

{

FILE *fp = (FILE *) rsrc->ptr;

fclose(fp);

}

把注册行添加到 PHP_MINIT_FUNCTION() 后，看起来应该如下面的代码：

PHP_MINIT_FUNCTION(myfile)

{

/* If you have INI entries, uncomment these lines

ZEND_INIT_MODULE_GLOBALS(myfile, php_myfile_init_globals,NULL);

REGISTER_INI_ENTRIES();

le_myfile = zend_register_list_destructors_ex(myfile_dtor,NULL,"standard-c-file", module_number);

return SUCCESS;

}

l 注意到 le_myfile 是一个已经被 ext_skel 脚本定义好的全局变量。

PHP_MINIT_FUNCTION() 是一个先于模块（扩展）的启动函数，是暴露给扩展的一部分 API 。下表提供可用函数简要的说明。

函数声明宏

函数声明宏	语义
PHP_MINIT_FUNCTION()	当 PHP 被装载时，模块启动函数即被引擎调用。这使得引擎做一些例如资源类型，注册 INI 变量等的一次初始化。
PHP_MSHUTDOWN_FUNCTION()	当 PHP 完全关闭时，模块关闭函数即被引擎调用。通常用于注销 INI 条目
PHP_RINIT_FUNCTION()	在每次 PHP 请求开始，请求前启动函数被调用。通常用于管理请求前逻辑。
PHP_RSHUTDOWN_FUNCTION()	在每次 PHP 请求结束后，请求前关闭函数被调用。经常应用在清理请求前启动函数的逻辑。
PHP_MINFO_FUNCTION()	调用 phpinfo() 时模块信息函数被呼叫，从而打印出模块信息。

新建和注册新资源 我们准备实现 file_open() 函数。当我们打开文件得到一个 FILE * ，我们需要利用资源机制注册它。下面的主要宏实现注册功能：

ZEND_REGISTER_RESOURCE(rsrc_result, rsrc_pointer, rsrc_type);

参考表格对宏参数的解释

ZEND_REGISTER_RESOURCE 宏参数

宏参数	参数类型
rsrc_result	zval , which should be set with the registered resource information. zval 设置为已注册资源信息
rsrc_pointer	Pointer to our resource data. 资源数据指针
rsrc_type	The resource id obtained when registering the resource type. 注册资源类型时获得的资源 id

文件函数 现在你知道了如何使用 ZEND_REGISTER_RESOURCE() 宏，并且准备好了开始编写 file_open() 函数。还有一个主题我们需要讲述。

当 PHP 运行在多线程服务器上，不能使用标准的 C 文件存取函数。这是因为在一个线程里正在运行的 PHP 脚本会改变当前工作目录，因此另外一个线程里的脚本使用相对路径则无法打开目标文件。为了阻止这种错误发生， PHP 框架提供了称作 VCWD （ virtual current working directory 虚拟当前工作目录）宏，用来代替任何依赖当前工作目录的存取函数。这些宏与被替代的函数具备同样的功能，同时是被透明地处理。在某些没有标准 C 函数库平台的情况下， VCWD 框架则不会得到支持。例如， Win32 下不存在 chown() ，就不会有相应的 VCWD_CHOWN() 宏被定义。

VCWD 列表

标准 C 库	VCWD 宏	说明
getcwd()	VCWD_GETCWD()
fopen()	VCWD_FOPEN
open()	VCWD_OPEN()	用于两个参数的版本
open()	VCWD_OPEN_MODE()	用于三个参数的 open() 版本
creat()	VCWD_CREAT()
chdir()	VCWD_CHDIR()
getwd()	VCWD_GETWD()
realpath()	VCWD_REALPATH()
rename()	VCWD_RENAME()
stat()	VCWD_STAT()
lstat()	VCWD_LSTAT()
unlink()	VCWD_UNLINK()
mkdir()	VCWD_MKDIR()
rmdir()	VCWD_RMDIR()
opendir()	VCWD_OPENDIR()
popen()	VCWD_POPEN()
access()	VCWD_ACCESS()
utime()	VCWD_UTIME()
chmod()	VCWD_CHMOD()
chown()	VCWD_CHOWN()

编写利用资源的第一个 PHP 函数

实现 file_open() 应该非常简单，看起来像下面的样子：

PHP_FUNCTION(file_open)

{

char *filename = NULL;

char *mode = NULL;

int argc = ZEND_NUM_ARGS();

int filename_len;

int mode_len;

FILE *fp;

if (zend_parse_parameters(argc TSRMLS_CC, "ss", &filename,&filename_len, &mode, &mode_len) == FAILURE) {

return;

}

fp = VCWD_FOPEN(filename, mode);

if (fp == NULL) {

RETURN_FALSE;

}

ZEND_REGISTER_RESOURCE(return_value, fp, le_myfile);

}

你可能会注意到资源注册宏的第一个参数 return_value ，可此地找不到它的定义。这个变量自动的被扩展框架定义为 zval * 类型的函数返回值。先前讨论的、能够影响返回值的 RETURN_LONG() 和 RETVAL_BOOL() 宏确实改变了 return_value 的值。因此很容易猜到程序注册了我们取得的文件指针 fp ，同时设置 return_value 为该注册资源。

访问资源 需要使用下面的宏访问资源（参看表对宏参数的解释）

ZEND_FETCH_RESOURCE(rsrc, rsrc_type, passed_id, default_id,

resource_type_name, resource_type);

ZEND_FETCH_RESOURCE 宏参数

参数	含义
rsrc	资源值保存到的变量名。它应该和资源有相同类型。
rsrc_type	rsrc 的类型，用于在内部把资源转换成正确的类型
passed_id	寻找的资源值 ( 例如 zval **)
default_id	如果该值不为 -1 ，就使用这个 id 。用于实现资源的默认值。
resource_type_name	资源的一个简短名称，用于错误信息。
resource_type	注册资源的资源类型 id

使用这个宏，我们现在能够实现 file_eof() ：

PHP_FUNCTION(file_eof)

int argc = ZEND_NUM_ARGS();

zval *filehandle = NULL;

FILE *fp;

if (zend_parse_parameters(argc TSRMLS_CC, "r", &filehandle) ==FAILURE) {

return;

}

ZEND_FETCH_RESOURCE(fp, FILE *, &filehandle, -1, "standard-c-file",le_myfile);

if (fp == NULL) {

RETURN_FALSE;

}

if (feof(fp) <= 0) {

/* Return eof also if there was an error */

RETURN_TRUE;

}

RETURN_FALSE;

删除一个资源 通常使用下面这个宏删除一个资源：

int zend_list_delete(int id)

传递给宏一个资源 id ，返回 SUCCESS 或者 FAILURE 。如果资源存在，优先从 Zend 资源列队中删除，该过程中会调用该资源类型的已注册资源清理函数。因此，在我们的例子中，不必取得文件指针，调用 fclose() 关闭文件，然后再删除资源。直接把资源删除掉即可。

使用这个宏，我们能够实现 file_close() ：

PHP_FUNCTION(file_close)

{

int argc = ZEND_NUM_ARGS();

zval *filehandle = NULL;

if (zend_parse_parameters(argc TSRMLS_CC, "r", &filehandle) == FAILURE) {

return;

}

if (zend_list_delete(Z_RESVAL_P(filehandle)) == FAILURE) {

RETURN_FALSE;

}

RETURN_TRUE;

}

你肯定会问自己 Z_RESVAL_P() 是做什么的。当我们使用 zend_parse_parameters() 从参数列表中取得资源的时候，得到的是 zval 的形式。为了获得资源 id ，我们使用 Z_RESVAL_P() 宏得到 id ，然后把 id 传递给 zend_list_delete() 。

有一系列宏用于访问存储于 zval 值（参考表的宏列表）。尽管在大多数情况下 zend_parse_parameters() 返回与 c 类型相应的值，我们仍希望直接处理 zval ，包括资源这一情况。

Zval 访问宏

宏	访问对象	C 类型
Z_LVAL, Z_LVAL_P, Z_LVAL_PP	整型值	long
Z_BVAL, Z_BVAL_P, Z_BVAL_PP	布尔值	zend_bool
Z_DVAL, Z_DVAL_P, Z_DVAL_PP	浮点值	double
Z_STRVAL, Z_STRVAL_P, Z_STRVAL_PP	字符串值	char *
Z_STRLEN, Z_STRLEN_P, Z_STRLEN_PP	字符串长度值	int
Z_RESVAL, Z_RESVAL_P,Z_RESVAL_PP	资源值	long
Z_ARRVAL, Z_ARRVAL_P, Z_ARRVAL_PP	联合数组	HashTable *
Z_TYPE, Z_TYPE_P, Z_TYPE_PP	Zval 类型	Enumeration (IS_NULL, IS_LONG, IS_DOUBLE, IS_STRING, IS_ARRAY, IS_OBJECT, IS_BOOL, IS_RESOURCE)
Z_OBJPROP, Z_OBJPROP_P, Z_OBJPROP_PP	对象属性 hash （本章不会谈到）	HashTable *
Z_OBJCE, Z_OBJCE_P, Z_OBJCE_PP	对象的类信息（本章不会谈到）	zend_class_entry

用于访问 zval 值的宏 所有的宏都有三种形式：一个是接受 zval s ，另外一个接受 zval *s ，最后一个接受 zval **s 。它们的区别是在命名上，第一个没有后缀， zval * 有后缀 _P （代表一个指针），最后一个 zval ** 有后缀 _PP （代表两个指针）。

现在，你有足够的信息来独立完成 file_read() 和 file_write() 函数。这里是一个可能的实现：

PHP_FUNCTION(file_read)

{

int argc = ZEND_NUM_ARGS();

long size;

zval *filehandle = NULL;

FILE *fp;

char *result;

size_t bytes_read;

if (zend_parse_parameters(argc TSRMLS_CC, "rl", &filehandle,&size) == FAILURE) {

return;

}

ZEND_FETCH_RESOURCE(fp, FILE *, &filehandle, -1, "standard-cfile", le_myfile);

result = (char *) emalloc(size+1);

bytes_read = fread(result, 1, size, fp);

result[bytes_read] = '/0';

RETURN_STRING(result, 0);

}

PHP_FUNCTION(file_write)

{

char *buffer = NULL;

int argc = ZEND_NUM_ARGS();

int buffer_len;

zval *filehandle = NULL;

FILE *fp;

if (zend_parse_parameters(argc TSRMLS_CC, "rs", &filehandle,&buffer, &buffer_len) == FAILURE) {

return;

}

ZEND_FETCH_RESOURCE(fp, FILE *, &filehandle, -1, "standard-cfile", le_myfile);

if (fwrite(buffer, 1, buffer_len, fp) != buffer_len) {

RETURN_FALSE;

}

RETURN_TRUE;

}

测试扩展 你现在可以编写一个测试脚本来检测扩展是否工作正常。下面是一个示例脚本，该脚本打开文件 test.txt ，输出文件类容到标准输出，建立一个拷贝 test.txt.new 。

<?php

$fp_in = file_open("test.txt", "r") or die("Unable to open input file/n");

$fp_out = file_open("test.txt.new", "w") or die("Unable to open output file/n");

while (!file_eof($fp_in)) {

$str = file_read($fp_in, 1024);

print($str);

file_write($fp_out, $str);

}

file_close($fp_in);

file_close($fp_out);

全局变量

你可能希望在扩展里使用全局 C 变量，无论是独自在内部使用或访问 php.ini 文件中的 INI 扩展注册标记（ INI 在下一节中讨论）。因为 PHP 是为多线程环境而设计，所以不必定义全局变量。 PHP 提供了一个创建全局变量的机制，可以同时应用在线程和非线程环境中。我们应当始终利用这个机制，而不要自主地定义全局变量。用一个宏访问这些全局变量，使用起来就像普通全局变量一样。

用于生成 myfile 工程骨架文件的 ext_skel 脚本创建了必要的代码来支持全局变量。通过检查 php_myfile.h 文件，你应当发现类似下面的被注释掉的一节，

ZEND_BEGIN_MODULE_GLOBALS(myfile)

int global_value;

char *global_string;

ZEND_END_MODULE_GLOBALS(myfile)

你可以把这一节的注释去掉，同时添加任何其他全局变量于这两个宏之间。文件后部的几行，骨架脚本自动地定义一个 MYFILE_G(v) 宏。这个宏应当被用于所有的代码，以便访问这些全局变量。这就确保在多线程环境中，访问的全局变量仅是一个线程的拷贝，而不需要互斥的操作。

为了使全局变量有效，最后需要做的是把 myfile.c ：

ZEND_DECLARE_MODULE_GLOBALS(myfile)

注释去掉。

你也许希望在每次 PHP 请求的开始初始化全局变量。另外，做为一个例子，全局变量已指向了一个已分配的内存，在每次 PHP 请求结束时需要释放内存。为了达到这些目的，全局变量机制提供了一个特殊的宏，用于注册全局变量的构造和析构函数（参考表对宏参数的说明）：

ZEND_INIT_MODULE_GLOBALS(module_name, globals_ctor, globals_dtor)

表 ZEND_INIT_MODULE_GLOBALS 宏参数

参数	含义
module_name	与传递给 ZEND_BEGIN_MODULE_GLOBALS() 宏相同的扩展名称。
globals_ctor	构造函数指针。在 myfile 扩展里，函数原形与 void php_myfile_init_globals(zend_myfile_globals *myfile_globals) 类似
globals_dtor	析构函数指针。例如， php_myfile_init_globals(zend_myfile_globals *myfile_globals)

你可以在 myfile.c 里看到如何使用构造函数和 ZEND_INIT_MODULE_GLOBALS() 宏的示例。

添加自定义 INI 指令

INI 文件 (php.ini) 的实现使得 PHP 扩展注册和监听各自的 INI 条目。如果这些 INI 条目由 php.ini 、 Apache 的 htaccess 或其他配置方法来赋值，注册的 INI 变量总是更新到正确的值。整个 INI 框架有许多不同的选项以实现其灵活性。我们涉及一些基本的（也是个好的开端），借助本章的其他材料，我们就能够应付日常开发工作的需要。

通过在 PHP_INI_BEGIN()/PHP_INI_END() 宏之间的 STD_PHP_INI_ENTRY() 宏注册 PHP INI 指令。例如在我们的例子里， myfile.c 中的注册过程应当如下：

PHP_INI_BEGIN()

STD_PHP_INI_ENTRY("myfile.global_value", "42", PHP_INI_ALL, OnUpdateInt, global_value, zend_myfile_globals, myfile_globals)

STD_PHP_INI_ENTRY("myfile.global_string", "foobar", PHP_INI_ALL, OnUpdateString, global_string, zend_myfile_globals, myfile_globals)

PHP_INI_END()

除了 STD_PHP_INI_ENTRY() 其他宏也能够使用，但这个宏是最常用的，可以满足大多数需要（参看表对宏参数的说明）：

STD_PHP_INI_ENTRY(name, default_value, modifiable, on_modify, property_name, struct_type, struct_ptr)

STD_PHP_INI_ENTRY 宏参数表

参数	含义
name	INI 条目名
default_value	如果没有在 INI 文件中指定，条目的默认值。默认值始终是一个字符串。
modifiable	设定在何种环境下 INI 条目可以被更改的位域。可以的值是： • PHP_INI_SYSTEM. 能够在 php.ini 或 http.conf 等系统文件更改 • PHP_INI_PERDIR. 能够在 .htaccess 中更改 • PHP_INI_USER. 能够被用户脚本更改 • PHP_INI_ALL. 能够在所有地方更改
on_modify	处理 INI 条目更改的回调函数。你不需自己编写处理程序，使用下面提供的函数。包括： • OnUpdateInt • OnUpdateString • OnUpdateBool • OnUpdateStringUnempty • OnUpdateReal
property_name	应当被更新的变量名
struct_type	变量驻留的结构类型。因为通常使用全局变量机制，所以这个类型自动被定义，类似于 zend_myfile_globals 。
struct_ptr	全局结构名。如果使用全局变量机制，该名为 myfile_globals 。

最后，为了使自定义 INI 条目机制正常工作，你需要分别去掉 PHP_MINIT_FUNCTION(myfile) 中的 REGISTER_INI_ENTRIES() 调用和 PHP_MSHUTDOWN_FUNCTION(myfile) 中的 UNREGISTER_INI_ENTRIES() 的注释。

访问两个示例全局变量中的一个与在扩展里编写 MYFILE_G(global_value) 和 MYFILE_G(global_string) 一样简单。

如果你把下面的两行放在 php.ini 中， MYFILE_G(global_value) 的值会变为 99 。

; php.ini – The following line sets the INI entry myfile.global_value to 99.

myfile.global_value = 99

线程安全资源管理宏

现在，你肯定注意到以 TSRM （线程安全资源管理器）开头的宏随处使用。这些宏提供给扩展拥有独自的全局变量的可能，正如前面提到的。

当编写 PHP 扩展时，无论是在多进程或多线程环境中，都是依靠这一机制访问扩展自己的全局变量。如果使用全局变量访问宏（例如 MYFILE_G() 宏），需要确保 TSRM 上下文信息出现在当前函数中。基于性能的原因， Zend 引擎试图把这个上下文信息作为参数传递到更多的地方，包括 PHP_FUNCTION() 的定义。正因为这样，在 PHP_FUNCTION() 内当编写的代码使用访问宏（例如 MYFILE_G() 宏）时，不需要做任何特殊的声明。然而，如果 PHP 函数调用其他需要访问全局变量的 C 函数，要么把上下文作为一个额外的参数传递给 C 函数，要么提取上下文（要慢点）。

在需要访问全局变量的代码块开头使用 TSRMLS_FETCH() 来提取上下文。例如：

void myfunc()

{

TSRMLS_FETCH();

MYFILE_G(myglobal) = 2;

}

如果希望让代码更加优化，更好的办法是直接传递上下文给函数（正如前面叙述的， PHP_FUNCTION() 范围内自动可用）。可以使用 TSRMLS_C （ C 表示调用 Call ）和 TSRMLS_CC （ CC 边式调用 Call 和逗号 Comma ）宏。前者应当用于仅当上下文作为一个单独的参数，后者应用于接受多个参数的函数。在后一种情况中，因为根据取名，逗号在上下文的前面，所以 TSRMLS_CC 不能是第一个函数参。

在函数原形中，可以分别使用 TSRMLS_D 和 TSRMLS_DC 宏声名正在接收上下文。

下面是前一例子的重写，利用了参数传递上下文。

void myfunc(TSRMLS_D)

{

MYFILE_G(myglobal) = 2;

}

PHP_FUNCTION(my_php_function)

{

…

myfunc(TSRMLS_C);

…

}

总结

现在，你已经学到了足够的东西来创建自己的扩展。本章讲述了一些重要的基础来编写和理解 PHP 扩展。 Zend 引擎提供的扩展 API 相当丰富，使你能够开发面向对象的扩展。几乎没有文档谈几许多高级特性。当然，依靠本章所学的基础知识，你可以通过浏览现有的原码学到很多。

更多关于信息可以在 PHP 手册的扩展 PHP 章节 http://www.php.net/manual/en/zend.php 中找到。另外，你也可以考虑加入 PHP 开发者邮件列表 internals@ lists.php.net ，该邮件列表围绕开发 PHP 本身。你还可以查看一下新的扩展生成工具—— PECL_Gen( http://pear.php.net/package/PECL_Gen ) ，这个工具正在开发之中，比起本章使用的 ext_skel 有更多的特性。