php自动采集模块,自动采集发布系统

本文介绍了使用QueryList4.0内核的自动化采集系统,该系统具备云端采集库,允许用户无需编写规则,直接从云端获取。同时,详细阐述了采集和发布的各个步骤及规则配置,包括标题、URL、内容和图片的采集规则,以及如何将采集数据发布到指定数据库表,并匹配相应的列名。此外,还强调了在编写规则时的注意事项。
摘要由CSDN通过智能技术生成

采集模块:

拥有云端采集库,规则都可以不写了。直接云端获取规则。一键采集入库发布。

采集用的是querylist 4.0内核,规则编写可以参照https://querylist.cc/docs/guide/v4/overview

5a5e2b63b226d.jpg

标题    就是  标题

链接    就是你要采集的页面URL

列表标题规则    就是你要采集的那个页面里面的列表 获取每一篇文章的标题规则

列表URL规则    就是你要采集的那个页面里面的列表 获取每一篇文章的URL规则

内页链接    就是一个测试采集内页的时候用到的链接

内页标题规则    就是内容页的标题规则

内页内容规则    就是内容页的内容规则

内页图片规则    就是内容页的图片规则

你不需要采集标题,你可以不填写标题规则;

注意:

采集规则中

.contLeftA  h1,text

逗号前后不能有空格。

发布模块:

发布的表名

你要发布到哪一个表

采集列名

content_title   采集数据

content_contg   内容数据

content_pic     图片数据

发布列名

意思是你要发布对应到哪一个列

可选参数,可选参数不可修改,这样写。不然报错:

is_login    发布者ID

time        时间

content_pic|img     获取第一张图

例:比如的的CMS表名是【posto】,里面包含以下列

title标题、uid发布者、content内容、img单图、status状态、create_time发布时间

规则就应该写

采集列名:content_title   发布列名:title

采集列名:content_contg  发布列名:content内容

采集列名:content_pic|img  发布列名:img

采集列名:is_login   发布列名:uid

采集列名:time   发布列名:create_time

采集列名:1   发布列名:status

5a5e2af79fd08.jpg

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值