如何编写PHP自定义模块和切入PHP调用linux底层的过程

希望本文能对那些想把php带向更宽的边界的工程师有所帮助.

一个php请求的完整流程:
   
浏览器用户--->web服务器(apache,nginx)--->Zend引擎从文件系统读取php代码文件--->Zend解释器工作
   
--->执行解释后的代码-->Zend引擎注册的函数接口-->内置模块或者各个需要的外部模块扩展-->数据库memcache等后端资源
   
   其中 
   Zend引擎注册的函数接口:就是php开发者经常接触的各种php函数.
   外部模块扩展:就是php编译的各个so文件(linux)或者dll文件(windwos).
   执行解释后的代码:浏览器的内容就是从这里返回的.
   内置模块:也就是php每次启动的时候会携带启动的模块.

从上面的流程图看php可以从3个点进行扩展.1 外部模块扩展 2 Zend引擎 3 内置模块,下面将一一讨论.
   
   外部模块扩展.
         如果你使用过dl()你就接触过这些外部的扩展模块.外部的扩展模块文件就放在你的硬盘里,他在php脚本运行时被加载到内存中,而且只有需要的时候才被加载.
   当此次的脚本运行完之后他就会被内存释放掉,总的来说它运行的慢但是不占资源.不需要重新编译一个php.
   
   内置模块
         虽然也是Zend引擎之外的模块,但是与外部模块扩展有些不同,他已经在php里边了.他会使得你编译的php体积变大,如果有改变,必须重新编译php才行.内置模块会使得
   php内存变大,但是调用起来也会更加的快速.在我们的测试中一些模块运行在内置模式会有30%以上的速度提升.
   
   Zend引擎
         首先,我绝对不建议你去修改Zend引擎.一些php语言的特性只要在Zend引擎中才能够实现.比如要修改数组关键字的名字,可以在这里实现.
   在下载的php源代码里,以zend开头的都是zend引擎的相关代码.
   

   外部模块扩展是下面要扩展的方式。

   下面以一个简单的模块为例子说明如何编写PHP外部模块扩展:
   
   首先编写php模块有自己的一套标准命名方式,你需要遵守,不然可能会导致你的模块无法释放变量或者其他的问题,这些标准包括 宏定义,变量声明等.你可以到官方浏览详细的说明.

 

/* 扩展的标准头 */
#include "php.h"
/* 声明这个so被导出的函数 */
ZEND_FUNCTION(helloworld_module);
/* Zend引擎注册的函数接口 */
zend_function_entry helloworldmod_interfaces[] =
{
    ZEND_FE(helloworld_module, NULL)
    {NULL, NULL, NULL}
};
/* 这是这个模块的声明实体,它的值对模块编译的时候起实际作用 */
zend_module_entry helloworldmod_module_entry =
{
    STANDARD_MODULE_HEADER,
    "Hello world",
    helloworldmod_interfaces,
    NULL, 
    NULL, 
    NULL, 
    NULL, 
    NULL,
    NO_VERSION_YET,
    STANDARD_MODULE_PROPERTIES
};

/* 向zend引擎声明一个备案,可以说明 helloworldmod_module_entry属于helloworldmod.so这个动态库*/
#if COMPILE_DL_helloworld_module
ZEND_GET_MODULE(helloworldmod)
#endif

/* 这就是我们新增的函数的真正代码 */
ZEND_FUNCTION(helloworld_module)
{
    return "Hello,world";
}

   一般php源码目录结构类似下面:
   main php的主要源代码,
   ext php的扩展 
   sapi 与不同服务器的api交互层代码
   zend zend引擎部分
   TSRM 线程安全相关模块代码

 

  我们编写的模块需要放在ext目录下面,可以根据其他扩展的config.m4文件来修改成我们的必要编译配置信息。这里这个模块几乎是一个空的config.m4文件就行,
   
   然后利用phpize来生成configure文件然后是 ./configure && make && make install执行就能编译一份的动态库

  编写测试test.php

<?php

echo helloworld_module();
?>      

     输出:
      "Hello,world"

 

   切入PHP调用linux底层的过程

在linux下面一个很给力的工具是LD_PRELOAD环境变量。
   
LD_PRELOAD环境变量是编译器找到程序中所引用的函数或全局变量所存在的位置的一个过滤器,比如,在php的c代码里调用一个开始网络连接的方法connect,事实上就是通过动态链接
   
去寻找linux的c库的函数connect,这些链接文件一般放在lib下面,这也就为影响php的代码执行提供了一个切入点。因为php程序在动态载入lib下面的函数connect之前会检查

LD_PRELOAD提供的动态库里有没有这个connect函数,可以在这里对php的行为进行干涉。

   
   下面以一个简单的过滤网络访问的例子说明如何实现:
   
   先是一个准备作为LD_PRELOAD环境变量的值的so文件的代码。
   lp_demo.c

#include <stdio.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <stdlib.h>
#include <errno.h>
#include <dlfcn.h>


//定义我们自己的connect函数
int  connect(int  sockfd,  const  struct sockaddr *serv_addr, socklen_t
             addrlen){
  static int (*connect_linuxc)(int, const  struct sockaddr*, socklen_t)=NULL;
  unsigned char *ip_char;
 
  //利用 lsym的RTLD_NEXT选项绕过LD_PRELOAD环境变量的connect方法找到c库的函数
  if (!connect_linuxc) connect_linuxc=dlsym(RTLD_NEXT,"connect");
 
    ip_char=serv_addr->sa_data;
    ip_char+=2;
 
    
     //192.168.2.3 找到了
    if ((*ip_char==192)&&(*(ip_char+1)==168)&&(*(ip_char+2)==2)&&(*(ip_char+3)==3)) {
    
         //简单返回一个权限错误的代码
            return EACCES;
    }
 
  
  // 调用真正的connect方法
   return connect_linuxc(sockfd,serv_addr,addrlen);
  
}

  编译成so文件


$ gcc -o lp_demo.so -shared lp_demo.c -ldl

测试文件 test.php

<?php
file_get_contents("http://192.168.2.3/");
?>

  使用方法
LD_PRELOAD=lp_demo.so php test.php


这样他将不可能访问的到192.168.2.3这种我们内部的网址。起到一个很好的沙盒作用。

除此之外我们还可以利用fwrite fopen等函数将php对文件系统的读写操作转移到mencache,nosql之类的后端资源当中。

PS:在c库下面,还有一堆sys_开头的函数,它们才是内核空间里的真正的函数。

转载于:https://www.cnblogs.com/NoSql/p/3223375.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值