php网页抓取类,php 利用递归抓取网页的类示例

这篇文章主要为大家详细介绍了php 利用递归抓取网页的类示例,具有一定的参考价值,可以用来参考一下。

对一个php递归抓取网页的类感兴趣的小伙伴,下面一起跟随512笔记的小编两巴掌来看看吧!

/**

* 一个php递归抓取网页的类

*

* @param

* @author 512笔记 www.512pic.com

**/

class crawler{

private $_depth=5;

private $_urls=array();

function extract_links($url)

{

if(!$this->_started){

$this->_started=1;

$curr_depth=0;

}else{

$curr_depth++;

}

if($curr_depth_depth)

{

$data=file_get_contents($url);

if(preg_match_all('/((?:http|https)://(?:www.)*(?:[a-zA-Z0-9_-]{1,15}.+[a-zA-Z0-9_]{1,}){1,}(?:[a-zA-Z0-9_/.-?&:%,!;]*))/',$data,$urls12))

{

foreach($urls12[0] as $k=>$v){

$check=get_headers($v,1);

if(strstr($v,$url) && $check[0]=='HTTP/1.1 200 OK' && !array_search($v,$this->_urls) && $curr_depth_depth){

$this->_urls[]=$v;

$this->extract_links($v);

}

}

}

}

return $this->_urls;

}

}

/*** 来自512笔记(www.512pic.com) ***/

?>

注:关于php 利用递归抓取网页的类示例的内容就先介绍到这里,更多相关文章的可以留意512笔记的其他信息。

关键词:递归,抓取网页

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值