通过Composer安装
composer require jaeger/querylist
示例
$text = ['1.','2.','3.','4.','5.','6.','7.'];
for($i=1;$i<6;$i++ ){
$infos=[];
$qu=new QueryList();
$url= 'https://www.854.com/zuoyouminglizhi/list_141_'.$i.'.html';
// $url= 'https://www.52dwx.com/juzi/cyj/';
$datainfo = $qu->get($url);
$data['primaryName'] = $datainfo->find('.list-title>h3')->text();
$links = $datainfo->find('h3>a')->attrs('href'); //获取搜索结果链接列表
if(!empty($links)){
foreach ($links as $item){
$qu= new QueryList();
$datainfo = $qu->get($item);
$data['secondName'] = $datainfo->find('h1')->text();
$Textlists = $datainfo->find('.ac-content>b,.ac-content>p')->texts(); //获取搜索结果链接列表
foreach ($Textlists as $index=>$vv){
foreach ($text as $v1){
if(strpos($vv,$v1) !== false){
$data['Textlists'][$index] = str_replace($v1,' ',$vv);
}
}
}
}
}
$path = APP_PATH.'/upload/text/'.$data['secondName'].'.josn';
file_put_contents($path, json_encode($data,JSON_UNESCAPED_UNICODE));
}
#采集百度
$ql = QueryList::get('http://www.baidu.com/s?wd=QueryList');
$ql->find('title')->text(); // 获取网站标题
$ql->find('meta[name=keywords]')->content; // 获取网站头部关键词
$ql->find('h3>a')->texts(); //获取搜索结果标题列表
$ql->find('h3>a')->attrs('href'); //获取搜索结果链接列表
$ql->find('img')->src; //获取第一张图片的链接地址
$ql->find('img:eq(1)')->src; //获取第二张图片的链接地址
$ql->find('img')->eq(2)->src; //获取第三张图片的链接地址
// 遍历所有图片
$ql->find('img')->map(function($img){
echo $img->alt; //打印图片的alt属性
});
总结:不了解QueryList的采集代码的 参考 QueryList V4 中文文档 - QueryList文档
期待大家点赞支持