php爬虫库QueryList的简单运用

本文介绍了PHP的QueryList库在爬虫开发中的应用,通过实例展示了如何利用该库抓取网页内容,包括HTML元素的选择、数据提取和处理等基本操作。
摘要由CSDN通过智能技术生成
 <?php
    require 'QueryList/phpQuery.php';
    require 'QueryList/QueryList.php';
    use QL\QueryList;   


    $url = 'http://www.netbian.com/baidu';
    $rules = array(
        'sensus_img'=> array('.list ul li>a>img','src'),
        'sensus_img_text'=> array('.list ul li>b>a','text'),
        'update_time'=> array('.list ul li p','text')
    );
    $data = QueryList::Query($url,$rules)->data;


    $time = date('Y-m-d');
    if(!is_dir($time)){
        mkdir($time);
    }


    foreach ($data as $key => $value) {
        if(isset($value['sensus_img']) && $value['sensus_img']){
            $img_ext = substr($value['sensus_img'], strrpos($value['sensus_img'], '.'));//图片后缀
            if(isset($value['sensus_img_text']) &&
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值