PHP 获取CSDN博客的文章链接

原理很简单,一看即懂。操作粗暴简单,哈哈。

href.php

<?php
    header("Content-type: text/html; charset=utf-8"); 
    $num = 0;

    for ($page=1; $page <99 ; $page++) { 
        $html = file_get_contents('https://blog.csdn.net/Cai181191/article/list/'.$page.'?');
        $dom = new DOMDocument();
        @$dom->loadhtml($html);  
        $xpath = new DOMXPath($dom);
        $hrefs = $xpath->evaluate('/html/body//main/div/div/h4/a');

        if ($hrefs->length==0) {
            print_r('<br/>'.'====================已经抓取到尾页了===================='.'<br/>');
            break;
        }

        else{
            for ($i = 0; $i < $hrefs->length; $i++) {  
                $href = $hrefs->item($i);// 获取a标签元素  
                $url = $href->getAttribute('href');// 获取a标签元素href属性的值  
                print_r($url.'<br/>');
                $num++;
            }
        }
        
    }
    print_r('一共有'.$num.'篇文章');
    
    
?> 

效果:


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值