一句话脚本原理php,深入理解PHP原理之PHP脚本执行原理(2)

最新推荐文章于 2024-03-16 18:00:00 发布

马丁.Success

最新推荐文章于 2024-03-16 18:00:00 发布

阅读量83

点赞数

文章标签：一句话脚本原理php

在上一篇《深入理解PHP原理之PHP脚本执行原理》文章中已经介绍了PHP的语法分析、词法分析和Opcodes的原理，下面主要通过一个具体的示例，来看看ZE是怎样对PHP脚本进行语法分析和词法分析，并将其编译为Opcodes，下面让我们回顾一下PHP脚本执行的基本流程：

1. Zend Engine(ZE)调用词法分析器(Lex生成的，源码路径：php/Zend/zend_language_sanner.l), 将我们要执行的PHP源文件去掉空格和注释后，分割成一个个的token；

2. ZE会将得到的token forward给语法分析器(yacc生成, 源码路径：php/Zend/zend_language_parser.y)，将Tokens转换成简单而有意义的表达式；

3. ZE会将转换后的表达式，编译为一个个opcode，opcode一般会以op_array的形式存在，它是PHP执行的中间语言。

4. ZE调用zend_executor来执行op_array，输出结果。

下面通过具体示例来讲解上述过程，还是以经典的“hello world”为示例，如下：

$code =<<

$str = "Hello World";

$a = 1 + 1;

echo $a;

PHP_CODE;

var_dump(token_get_all($code));

函数token_get_all()可以将一段PHP代码 Scanning成tokens，分割后的结果如下：

array(19) {

[0]=>

array(3) {

[0]=>

int(367)

[1]=>

string(6) "<?php "

[2]=>

int(1)

}

[1]=>

array(3) {

[0]=>

int(370)

[1]=>

string(1) " "

[2]=>

int(2)

}

[2]=>

string(1) "="

[3]=>

array(3) {

[0]=>

int(370)

[1]=>

string(1) " "

[2]=>

int(2)

}

[4]=>

array(3) {

[0]=>

int(315)

[1]=>

string(13) ""Hello World""

[2]=>

int(2)

}

[5]=>

string(1) ";"

[6]=>

array(3) {

[0]=>

int(370)

[1]=>

string(2) " "

[2]=>

int(2)

}

[7]=>

string(1) "="

[8]=>

array(3) {

[0]=>

int(370)

[1]=>

string(1) " "

[2]=>

int(3)

}

[9]=>

array(3) {

[0]=>

int(305)

[1]=>

string(1) "1"

[2]=>

int(3)

}

[10]=>

array(3) {

[0]=>

int(370)

[1]=>

string(1) " "

[2]=>

int(3)

}

[11]=>

string(1) "+"

[12]=>

array(3) {

[0]=>

int(370)

[1]=>

string(1) " "

[2]=>

int(3)

}

[13]=>

array(3) {

[0]=>

int(305)

[1]=>

string(1) "1"

[2]=>

int(3)

}

[14]=>

string(1) ";"

[15]=>

array(3) {

[0]=>

int(370)

[1]=>

string(1) " "

[2]=>

int(3)

}

[16]=>

array(3) {

[0]=>

int(316)

[1]=>

string(4) "echo"

[2]=>

int(4)

}

[17]=>

array(3) {

[0]=>

int(370)

[1]=>

string(1) " "

[2]=>

int(4)

}

[18]=>

string(1) ";"

}

通过上面的返回结果，我们发现第一步“词法分析”将php脚本分割成数组array，该数组中包括php脚本中的空格、字符、操作数、语句等。在第二步“语法分析”中，数组array中的操作符、语句和标签等会根据文件php/Zend/zend_language_parser.y转换成tokens(下面是该文件部分源码，包含echo、while等关键字的tokens转换)，但是字符串，字符，空格等不会，转换后的内容包含两个部分的Array：Token ID (也就是在Zend内部的改Token的对应码)和源码中的原来的内容。

%token T_IF "if (T_IF)"

%token T_ELSEIF "elseif (T_ELSEIF)"

%token T_ELSE "else (T_ELSE)"

%token T_ENDIF "endif (T_ENDIF)"

%token T_ECHO "echo (T_ECHO)"

%token T_DO "do (T_DO)"

%token T_WHILE "while (T_WHILE)"

然后就是Parsing阶段，Parsing首先会丢弃Tokens Array中的多余的空格，然后将剩余的Tokens转换成一个个简单的表达式，Parsing后的结果大致如下：

* ZEND_ECHO 'Hello World' // echo a constant string

* ZEND_ADD ~0 1 1 // add two numbers together

* ZEND_ASSIGN !0 ~0 // store the result of the prior expression to a variable

* ZEND_ECHO !0 // echo a variable