源码地址:https://github.com/LeeToug/NewsGather
最近公司需要做一个信息发布网站,任务分配下来之后确定我来主导这个项目。由于之前做小说采集网站的时候多用的是CMS自带的采集系统,但是本人实在不怎么感冒cms,所以在网上查看了一些资料,很神奇的找到了Querylist这个东西,今天就将我昨晚这次项目的里程分享一下。
首先,querylist官网(http://www.querylist.cc),直接点击文档走起。
大概看了一下,可以满足我的需求。okay,thinkphp5框架搭起来,使用composer安装querylist,安装之后本地出现gaegar文件夹,进去之后就会看到querylist了。至此,完成了安装的步骤啦,就是这么简单!!!
接下来就是使用Querylist类啦,一步一步来走:
首先引入类
use QL\QueryList;
然后重点
$html = "http://www.***.com";
//选择大的区域
$selector = "body";
//获取当前所选区域html
$content=QueryList::get($html)->find($selector)->html();
//最外层规则筛选
$rules = array(
'plist' => ['dt','html']
);
/