天猫php采集列表,QueryList: QueryList是一个基于phpQuery的通用列表采集类,是一个简单、 灵活、强大的采集工具,采集任何复杂的页面 基本上就一句话就能搞定了。...

#QueryList交流社区: http://querylist.cc/

#QueryList文档: http://doc.querylist.cc/

#QueryList交流QQ群:123266961 a0f609b288c7de88131b6f6ba37c81b3.png

#QueryList简介

QueryList是一个基于phpQuery的通用列表采集类,是一个简单、 灵活、强大的采集工具,采集任何复杂的页面 基本上就一句话就能搞定了。

#QueryList 使用

//获取采集对象

$hj = QueryList::Query('http://www.baidu.com/s?wd=QueryList',array('title'=>array('h3','text'),'link'=>array('h3>a','href')));

//输出结果:二维关联数组

print_r($hj->data);

上面的代码实现的功能是采集百度搜索结果页面的所有搜索结果的标题和链接,然后分别以二维关联数组的格式输出。

Query() 静态方法

返回值:QueryList对象

Query方法为QueryList唯一的主方法,用静态的方式调用。

原型:

QueryList::Query($page,array $rules, $range = '', $outputEncoding = null, $inputEncoding = null,$removeHead = false)

中文解释:

QueryList::Query(采集的目标页面,采集规则[,区域选择器][,输出编码][,输入编码][,是否移除头部])

//采集规则

$rules = array(

'规则名' => array('jQuery选择器','要采集的属性'[,"标签过滤列表"][,"回调函数"]),

'规则名2' => array('jQuery选择器','要采集的属性'[,"标签过滤列表"][,"回调函数"]),

..........

[,"callback"=>"全局回调函数"]

);

//注:方括号括起来的参数可选

参数解释:

QueryList 扩展

Request扩展

可以实现如携带cookie、伪造来路等任意复杂的网络请求,再也不用担心QueryList内置的抓取功能太弱了。

Login扩展

可以实现模拟登陆然后采集。

Multi扩展

多线程(多进程)采集扩展。

扩展通过QueryList::run 方法运行。

##QueryList 安装

composer require jaeger/querylist

包含QueyListy以及扩展的完整Composer配置如下:

{

"require": {

"jaeger/querylist": "^3.1",

"jaeger/querylist-ext-request":"^1.0",

"jaeger/querylist-ext-multi":"^1.0",

"jaeger/querylist-ext-login":"^1.0"

}

}

##QueryList 依赖库

phpQuery

##其它说明

QueryList 内置的只是简单的源码抓取方法,遇到更复杂的抓取情况,如:需要登陆

身份验证 时,请配合其它的PHP的HTTP类来使用,通过将辅助的HTTP类抓取到的网页源码传给QueryList即可。

##DEMO站

thinkphp版本:V3.1.2

QueryList版本:V1.6

后台地址: /admin

后台账号密码: guest guest

这个demo站实现的功能相当于一个轻量级的微博站,内容全自动采集更新,可以自定义时间间隔采集任意站点的信息,自动更新到这个站点来,只需要在后台规则库简单的添加一条规则就可以实现全自动采集了,大家可以自行进入后台进行尝试,体验QueryList的魅力!

##作者信息

Author : Jaeger

Email : hj.q@qq.com

交流QQ群:123266961

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1. 打开新增的文件 将里面的文件全部传进去 覆盖 2. 打开数据库找到表ecs_admin_action,把字段action_id型改为mediumint(8)。 3 . 打开 数据库执行文件 将里面的文件一个个打开在数据库里执行 4, 在 admin\includes/inc_menu.php 底部( ? )的上面添加以下代码 记住是?上面 $modules['02_taobao']['17_3setting'] = 'shops.php?act=tb_setting'; $modules['02_taobao']['17_1others'] = 'shops.php?act=others'; $modules['02_taobao']['17_2oalmm'] = 'shops.php?act=shopdata'; $modules['02_taobao']['17_20oalmm'] = 'shops.php?act=batchco'; $modules['02_taobao']['17_3talmm'] = 'shops.php?act=tools'; $modules['02_taobao']['17_4qq'] = 'http://wpa.qq.com/msgrd?v=3&uin=154978761&site=qq&menu=yes'; 5.打开 languages\zh_cn\admin/common文件 搜索 $_LANG['16_email_manage'] = '邮件群发管理'; 在这段下面添加 以下代码 /*淘宝管理*/ $_LANG['02_taobao'] = '<font style="color:#ff4200">淘宝</font><font style="color:#cc0099">天猫</font>'; $_LANG['17_3setting'] = '<font style="color:#0066FF">采集设置</font>'; $_LANG['17_1others'] = '<font style="color:#0066FF">常规采集</font>'; $_LANG['17_2oalmm'] = '<font style="color:#0066FF">店铺采集</font>'; $_LANG['17_20oalmm'] = '<font style="color:#0066FF">批量ID采集</font>'; $_LANG['17_200oalmm'] = '<font style="color:#0066FF">常规采集</font>'; $_LANG['17_2collect'] = '<font style="color:#0066FF">批量采集</font>'; $_LANG['17_data_list'] = '<font style="color:#0066FF">数据查询</font>'; $_LANG['17_3talmm'] = '<font style="color:#0066FF">工具箱</font>'; $_LANG['17_4qq'] = '<font style="color:#FF0000">联系客服</font>';
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值