采集模块:
拥有云端采集库,规则都可以不写了。直接云端获取规则。一键采集入库发布。
采集用的是querylist 4.0内核,规则编写可以参照https://querylist.cc/docs/guide/v4/overview
标题 就是 标题
链接 就是你要采集的页面URL
列表标题规则 就是你要采集的那个页面里面的列表 获取每一篇文章的标题规则
列表URL规则 就是你要采集的那个页面里面的列表 获取每一篇文章的URL规则
内页链接 就是一个测试采集内页的时候用到的链接
内页标题规则 就是内容页的标题规则
内页内容规则 就是内容页的内容规则
内页图片规则 就是内容页的图片规则
你不需要采集标题,你可以不填写标题规则;
注意:
采集规则中
.contLeftA h1,text
逗号前后不能有空格。
发布模块:
发布的表名
你要发布到哪一个表
采集列名
content_title 采集数据
content_contg 内容数据
content_pic 图片数据
发布列名
意思是你要发布对应到哪一个列
可选参数,可选参数不可修改,这样写。不然报错:
is_login 发布者ID
time 时间
content_pic|img 获取第一张图
例:比如的的CMS表名是【posto】,里面包含以下列
title标题、uid发布者、content内容、img单图、status状态、create_time发布时间
规则就应该写
采集列名:content_title 发布列名:title
采集列名:content_contg 发布列名:content内容
采集列名:content_pic|img 发布列名:img
采集列名:is_login 发布列名:uid
采集列名:time 发布列名:create_time
采集列名:1 发布列名:status