php字符串拷贝,PHP中的字符串连接操作

上周和刘志强同学讨论字符串的连接操作:

一般情况下我们用点号做字符串的连接操作,但是如果在某个长字符串中放一个变量,通常我们会采用在字符串中直接写入一个变量的方式来实现

$var = 10;

$str = "test string begin " . $var . " end";

//或

$var = 10;

$str = "test string begin $var end";

这二者有什么区别呢?

以VLD扩展直接查看这两段代码生成的中间代码:

点号连接:

number of ops: 7

compiled vars: !0 = $var, !1 = $str

line # * op ext return operands

------------------------------------------------

2 0 > EXT_STMT

1 ASSIGN !0, 10

3 2 EXT_STMT

3 CONCAT ~1 'test+string+begin+', !0

4 CONCAT ~2 ~1, '+end'

5 ASSIGN !1, ~2

6 > RETURN 1

直接在字符串中插入变量:

number of ops: 8

compiled vars: !0 = $var, !1 = $str

line # * op ext return operands

----------------------------------------------------

2 0 > EXT_STMT

1 ASSIGN !0, 10

3 2 EXT_STMT

3 ADD_STRING ~1 'test+string+begin+'

4 ADD_VAR ~1 ~1, !0

5 ADD_STRING ~1 ~1, '+end'

6 ASSIGN !1, ~1

7 > RETURN 1

对比这段生成的中间码,其原理完全不一样:

点号是典型的连接操作(当然,它本来就是连接操作),

当使用多个点号是,每两个点号的结果都会使用一个临时变量存储起来,并作为下一个操作的一个操作数。如在我们的示例中,首先是执行第一个连接操作,将“test string begin ”和$var连接起来,得到“test string begin 10”,然后再执行第二个连接操作,将上一个操作得到的结果“test string begin 10”和” end”连接起来,并将结果存储在另一个临时变量,最后将第二个连接操作的结果赋值给$str。

连接操作对应的opcode为ZEND_CONCAT,对于所给的两个操作数,其最终通过concat_function函数将两个字符串连接起来,如果所给的变量的类型不是字符串,则会通过zend_make_printable_zval将其转换成字符串。concat_function函数会根据两个字符串的长度重新分配内存,并执行两次拷贝操作,将两个字符串拷贝到新的内存空间。

这里针对两个字符串相同的情况有一个特殊处理。

如下:

if (result==op1) {/* special case, perform operations on result */

uint res_len = Z_STRLEN_P(op1) + Z_STRLEN_P(op2);

Z_STRVAL_P(result) = erealloc(Z_STRVAL_P(result), res_len+1);

memcpy(Z_STRVAL_P(result)+Z_STRLEN_P(result), Z_STRVAL_P(op2), Z_STRLEN_P(op2));

Z_STRVAL_P(result)[res_len]=0;

Z_STRLEN_P(result) = res_len;

} else {

Z_STRLEN_P(result) = Z_STRLEN_P(op1) + Z_STRLEN_P(op2);

Z_STRVAL_P(result) = (char *) emalloc(Z_STRLEN_P(result) + 1);

memcpy(Z_STRVAL_P(result), Z_STRVAL_P(op1), Z_STRLEN_P(op1));

memcpy(Z_STRVAL_P(result)+Z_STRLEN_P(op1), Z_STRVAL_P(op2), Z_STRLEN_P(op2));

Z_STRVAL_P(result)[Z_STRLEN_P(result)] = 0;

Z_TYPE_P(result) = IS_STRING;

}

示例执行了两次连接操作,则执行了两次内存分配操作和四次拷贝操作。

而直接在字符串中插入变量,其所有的操作都是添加操作,将字符串添加到返回值,将变量添加到返回值,

所有的结果返回都是在一个临时变量中,如我们的示例,首先会将”test string begin “添加到临时变量,然后将临时变量和$var变量添加到临时变量,之后将临时变量和” end”添加到临时变量,最后将此此时变量赋值给$str。这里添加将字符串添加到临时变量,其对应的opcode为ZEND_ADD_STRING,将变量添加到临时变量,其对应的opcode为ZEND_ADD_VAR,虽然这两个操作的opcode不同,但其最终调用都是add_string_to_string,他们所不同的调用此函数的第三个参数,一个是操作码存储的ZVAL变量,一个是通过变更列表获取的ZVAL变量。

其调用结构如下:

// 添加字符串

zval *str = &EX_T(opline->result.u.var).tmp_var;

add_string_to_string(str, str, &opline->op2.u.constant);

//添加变量

zval *str = &EX_T(opline->result.u.var).tmp_var;

zval *var = _get_zval_ptr_tmp(&opline->op2, EX(Ts), &free_op2 TSRMLS_CC);

add_string_to_string(str, str, var);

在添加变量时,如果添加的变量不是字符串,会通过zend_make_printable_zval将变量转换成字符串输出,如数组会转换成Array。

add_string_to_string的实现在Zend/zend_operators.c文件中:

/* must support result==op1 */

ZEND_API int add_string_to_string(zval *result, const zval *op1, const zval *op2) /* {{{ */

{

int length = Z_STRLEN_P(op1) + Z_STRLEN_P(op2);

Z_STRVAL_P(result) = (char *) erealloc(Z_STRVAL_P(op1), length+1);

memcpy(Z_STRVAL_P(result)+Z_STRLEN_P(op1), Z_STRVAL_P(op2), Z_STRLEN_P(op2));

Z_STRVAL_P(result)[length] = 0;

Z_STRLEN_P(result) = length;

Z_TYPE_P(result) = IS_STRING;

return SUCCESS;

}

/* }}} */

add_string_to_string函数的实现过程是针对即将生成的字符串的大小重新通过PHP内核的内存管理扩展内存空间(如果当前空间后续的内存够用,则天下太平,如果空间不够,则重新分配空间并执行拷贝操作),并将新的字符串复制到原始字串后面内存空间的过程。

我们的示例执行了三次添加操作,也就执行了三次内存扩展操作和三次拷贝操作。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值