querylist采集博客园博客

这两天在学下采集,使用querylist,使用起来非常简单

采集博客园博客代码

<?php
namespace app\index\controller;
use QL\QueryList;
class Index
{
   public function index()
    {
        $article=[];
        for($i=1;$i<=13;$i++){
        $ql = QueryList::get('https://www.cnblogs.com/jcydd/default.html?page='.$i);


    // 采集文章链接
   $rt= $ql->find('.postTitle a')->attrs('href');
   //halt($rt);
    
   foreach($rt as $k=>$v){
       
       $ql2=QueryList::get($v);
       $article[$i.$k]['title']=$ql2->find('#cb_post_title_url')->text();
       $article[$i.$k]['date']=$ql2->find('#post-date')->text();
       $article[$i.$k]['date']=strtotime($article[$i.$k]['date']);
       $content=$ql2->find('#cnblogs_post_body')->html();
       //获取文章图片链接
       $img=$ql2->find('#topics img')->attrs('src');
        //如果文章有图片,则替换图片本地地址
       if(count($img)==0){
          $article[$i.$k]['content']=$content;
       }else{
       foreach($img as $vv){
           $newimgurl=getimg($vv);
           $content=str_replace($vv,$newimgurl,$content);
       }
       $article[$i.$k]['content']=$content;
       }
       
      
   }
  
    
    }
    dump($article);
    
    }

   
}

 

转载于:https://www.cnblogs.com/jcydd/p/10905673.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值