PHP抓取页面中a标签的href属性值以及a中间内容

$str = file_get_contents($zh_cn_url);

$reg1='/<a href=\"(.*?)\".*?>(.*?)<\/a>/i';//匹配所有A标签

preg_match_all($reg1,$str,$aarray);

//这个$aarray 你可以打印一下看下你具体的业务需要哪个数组

//这个$aarray 是整个抓取的核心

$reg2="/href=\"([^\"]+)/";//获取href中的值

$arr = array();

for($i=1;$i<=3;$i++){

//这里讲一下我抓取的是前三个所以只需要 1=< i <=3就可以了

//如果想取出所有需要将for改为

//for($i=0;$i<count($aarray[0][$i]);$i++)

    preg_match_all($reg2,$aarray[0][$i],$hrefarray);

    $reg3="/>(.*)<\/a>/";//a标签中的内容

    preg_match_all($reg3,$aarray[0][$i],$acontent);

 

    $arr[$i]['title'] = $acontent[1][0];

 

    $arr[$i]['url'] = $server_name.$hrefarray[1][0];

 

}                                               

$data = array();

foreach ($arr as $key=>$val){

    $data[] = $val;

}

//为什么还要用个foreach 在放进一个新的数组里 ,这里讲一下,为了迎合我的业务逻辑需要将该数组的内容变为

//array(

//     array('title'=>'a中内容1','url'=>'href属性值1'),

  //     array('title'=>'a中内容2','url'=>'href属性值2'),

//     array('title'=>'a中内容3','url'=>'href属性值3'),

// );

return $json = json_encode($data); //返回json格式当然你也可以返回数组,直接 return $data即可                             

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

PHP开光程序员

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值