php审核里面的query怎样写,使用PHP的QueryList来写一个小爬虫玩玩~

该博客展示了如何使用php进行网页数据抓取。通过包含QueryList库,定义了要抓取的网页元素,并将抓取到的数据存储为JSON文件。每页抓取10条数据,直到完成10页的抓取。内容包括房源标题、价格、小区、地址、户型和更新时间。
摘要由CSDN通过智能技术生成

public function actionIndex(){

header("Content-type:text/html;charset=utf-8");

Includes('Query/QueryList.php');Includes('Query/phpQuery.php');

$option = array(

"title"=>array('.liebiao h1','text'),

'money'=>array('.liebiao .zm_money span','text'),

'xiaoqu'=>array('.liebiao ul li.info p:nth-child(2)','text'),

'dizhi'=>array('.liebiao ul li.info p:nth-child(3)','text'),

'huxin'=>array('.liebiao ul li.info p:nth-child(4)','text'),

'uodateTime'=>array('.liebiao ul li.info p:nth-child(5)','text'),

);

$page = isset($_GET['page'])?$_GET['page']:'1';

$hj = QueryList::Query('http://www.kuaiyoujia.com/zufangs/house/quyu-i'.$page,$option);

$result = $hj->data;

$TempArr = [];

foreach($result as $key=>$value){

$SetArr = [];

foreach($value as $k=>$v){

$SetArr[$k] = trimall($v);

}

$TempArr[$key] = $SetArr;

}

$ArrTemp = [];

for ($i = 0; $i <10 ; $i++) {

$ArrTemp[$i] = $TempArr[$i];

}

file_put_contents($_SERVER['DOCUMENT_ROOT'].'/uploads/HouseInfo_'.$page.'.json',json_encode($ArrTemp).PHP_EOL, FILE_APPEND);

if($page <= 10){

p('第'.$page.'次');

$page = $page+1;

Header('Location:http://127.0.0.1/index.php/wechat?page='.$page);

}else{

p('爬完了...');

}

}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值