php 取网页的a标签,php 正则配备网页a标签 内容及网址

[php]

function curl_get_contents($url)

{

$curl = curl_init();

// 设置你需要抓取的URL

curl_setopt($curl, CURLOPT_URL,$url);

// 设置header

curl_setopt($curl, CURLOPT_HEADER, 0);

// 设置cURL 参数,要求结果保存到字符串中还是输出到屏幕上。

curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);

curl_setopt ($curl, CURLOPT_CONNECTTIMEOUT,10);

// 运行cURL,请求网页

$data = curl_exec($curl);

if($data === false){

echo curl_error($curl);

exit;

}

$info = curl_getinfo($curl);

//print_r($info);

// 关闭URL请求

curl_close($curl);

// 显示获得的数据

//print_r($data);

return $data;

}

/*获取页面的URL地址*/

function geturl($url)

{

$http=substr($url,0,12);

// $strSource = file_get_contents($url);

$strSource = curl_get_contents($url);

preg_match_all(‘/(.+?)/sim’, $strSource, $strResult, PREG_PATTERN_ORDER);

$urllist = array();

for($i = 0; $i < count($strResult[1]); $i++)

{

// printf("%d href=(%s) title=(%s) \n", $i, $strResult[1][$i], $strResult[2][$i]);

//printf(" %s ", $strResult[1][$i], $strResult[2][$i]);

$url=$strResult[1][$i];

if(substr($url,0,12)==$http)

{

//判断是否重复

if(!in_array($strResult[1][$i], $urllist))

{

$urllist[]=$strResult[1][$i];

}

}

}

return $urllist;

}

[/php]

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值