QueryList_PHP采集框架

QueryList 是什么

QueryList是一套用于内容采集的PHP工具,它使用更加现代化的开发思想,语法简洁、优雅,可扩展性强。相比传统的使用晦涩的正则表达式来做采集,QueryList使用了更加强大而优雅的CSS选择器来做采集,大大降低了PHP做采集的门槛,同时也让采集代码易读易维护,让你从此告别晦涩难懂且不易维护的正则表达式。

QueryList 提供的一整套内容采集解决方案

DOM内容选择:CSS选择器
HTTP客户端:GuzzleHTTP
内容过滤:CSS选择器
解决乱码:内置多套乱码解决方案
额外功能:丰富的扩展插件

项目结构(有需求的联系博主)

代码示例

<?php
/**
 * @version 4.0.0
 * @document https://www.querylist.cc/docs/guide/v4/http-client
 * vender/tightenco/collect/src/Collect/Support/Arr.php 384行:
 * [$value, $key] = static::explodePluckParameters($value, $key);
 * 此用法php版本需>=7.1 
 * 若版本为7.0 则替换为
 * list($value,$key) = static::explodePluckParameters($value, $key);
 */
require "vendor/autoload.php";
use QL\QueryList;
/**
 * 基本用法实例
 */
class GraspTools
{
    //抓取图片
    public function graspImg($src)
    {
        $res = QueryList::get($src)->find('img')->attrs('src');
        dump($res);
    }
    //获取百度结果
    public function getBaiduSearch($wd)
    {
        $data = QueryList::get("http://www.baidu.com/s?wd={$wd}")
            //设置采集规则
            ->rules([ 
                'title' => array('h3','text'),
                'link'  => array('h3>a','href')
            ])
            ->query()
            ->getData();
        dump( $data->all() );
    }
}
( new GraspTools() )->graspImg('http://www.nipic.com');
( new GraspTools() )->getBaiduSearch('蔡徐坤');



									

作者:如若时光萧瑟去丶

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值