PHP querylist 页面采集、爬虫 获取页面内容(获取数据为对象没有html标签)

第一步 安装php querylist 采集框架  composer 安装

composer require jaeger/querylist

安装成功后 

// 引入命名空间

use QL\QueryList;

// 实例化 对象
      $ql = new QueryList();

正常情况下如果要获取指定的内容

 

反键a标签 选择copy 选择copy selector 即可复制到当前class 对应位置

      $html =  $ql->get($url)->find("#main > div > ul > li:nth-child(1) > a");

打印$html 即可获取到html内容

另一种情况这是返回 对象内容 没有html 

 

 选择则需要 获取到当前链接的 html内容 通过正则匹配获取到对应html数据

$html = $ql->get($url)->getHtml();

示例

    function cms_get_article($url = ''){
      $ql = new QueryList();
      $url = "xxxx";
//      获取页面html内容
      $html =  $ql->get($url)->getHtml();
//      获取截取内容
      preg_match_all("/<div class=\"entry-content\">.*?<\/div>/ism",$html,$content);
//      去除不需要的内容
      $text_content = preg_replace("/<div class=\"c-article-header\">(.*?)<\/div>/ism",'',$content[0][0]);
//      获取字符串长度
      $lenght = strlen("<aside class=\"c-article-more\">");
//       获取当前支付所在位置
      $count=strpos($text_content,"<aside class=\"c-article-more\">");
//  去除不需要的内容
      $str = substr_replace($text_content,"",$count,$lenght);
      echo $str;

    }

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

fuchto

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值