php采集正则,php不用正则采集速度探究总结

本文对比了不用正则的三个函数(str_cut, str_cut1, str_cut3)与strcut, str_cut_all, my_Ca的性能,强调算法对效率的影响。通过实例展示了在处理多个匹配时数组函数的优势,并揭示了在选择函数时关键在于算法设计。
摘要由CSDN通过智能技术生成

注意:下面的所有函数都没有用正则。

以上为取出第一个匹配的三个函数,实现相同的目的

复制代码 代码如下:

function str_cut($str ,$start, $end) {//取出第一个匹配,效率最高,先分割再替换

$content = strstr( $str, $start );

$content = substr( $content, strlen( $start ), strpos( $content, $end ) - strlen( $start ) );

return $content;

}

function str_cut1($str ,$start, $end) {//取出第一个匹配,效率中,直接查找替换

$x = strpos($str, $start);

return substr($str, $x+strlen($start), strpos($str, $end)-$x+strlen($end));

}

function str_cut3($content,$start,$end){//取出第一个匹配,字符串越大,速度越慢!

$my = explode($start,$content);

$my = explode($end,$my[1]);

return $my[0];

}

以下为取出所有匹配的3个函数(全部原创),实现相同的采集目的

复制代码 代码如下:

function strcut($str ,$start, $end) //先搜个数,速度中等

{

if( strpos( $str , $start ) )

{

$sum = substr_count($str,$start);

$carr = array();

for($i=0;$i

$str = strstr( $str, $start );

$str = substr( $str, strlen($start));

$carr[] = substr( $str, 0, strpos( $str, $end ) );

}

}

return $carr;

}

function str_cut_all($str ,$start, $end,$carr=array()) //递归,运行效率最慢!

{

if( strpos( $str , $start ) )

{

$str = strstr( $str, $start );

$str = substr( $str, strlen($start));

$carr[] = substr( $str, 0, strpos( $str, $end ) );

if( strpos( $str , $start ) )

{

return str_cut_all($str ,$start, $end ,$carr );

}

}

return $carr;

}

function my_Ca($content,$start,$end){//取出所有匹配,效率最快,因为只读一次,字符串越大越明显

$m = explode($start,$content);

$a = array();

for( $i = 1;$i 

{

$my = explode($end,$m[$i]);

$a[] = $my[0];

unset($my);

}

return $a;

}

注意my-Ca比较

如果这样写:

复制代码 代码如下:

function my_Ca($content,$start,$end){//取出所有匹配

$m = explode($start,$content);

$a = array();

$sum = count($m);

for( $i = 1;$i 

{

$my = explode($end,$m[$i]);

$a[] = $my[0];

unset($my);

}

return $a;

}

速度又快了一些!

由上可以看出,并不是数组处理函数(explode)比字符串处理函数(substr等)慢,也不是那个比这个快,因为在匹配多个数据的时候匹配的越多数组函数的优势越大,处理字符串就象切蛋糕一样越切越小。匹配单个字符串运用切的思路去做也是一样的效果(str_cut)。关键还是在---算法!算法写的好,什么函数都是一样哦!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值