如何创建模板

122 篇文章 2 订阅
85 篇文章 1 订阅

【场景描述】

创建模板:对需要采集的网站,首先梳理网站的层级结构,以确定在软件中需要配置几层模板。

【创建步骤】

从网站入口页到目标数据页,一共需要跳转几层不同网页结构的页面,通常就需要几层模板。每个模板代表了一个不同网页结构层级的页面,配置后就可以采集全站数据。

 【列表页1】

列表页网页结构如图列表页1所示,其对应创建的模板为:“默认模板:01”。

【数据页1】

如图数据页1,数据页网页结构与列表页1的网页结构不同,则此时需新建模板:“默认模板:02”。

1.添加模板

在模板列表的右键菜单,点击“添加采集模板”即可添加一层模板。

 【添加采集模板】

点击模板,会跳转到该模板的配置界面,进行模板属性的配置。

 【模板配置界面】

2.抽取链接/数据

根据页面内容,确定每层模板的抽取目标,每层模板都可以创建多个抽取。

①抽取链接:需要抽取页面上的链接时,选择创建链接抽取。如抽取该页面的链接列表和翻页,则创建两个链接抽取。

②抽取数据:需要抽取页面上的数据时,选择创建数据抽取。一个数据抽取对应着一张数据表,通常一个模板只需要一个数据抽取。

如果需要添加新的链接抽取和数据抽取,可按下方如图所示进行添加:

 【添加链接抽取】

【添加数据抽取】

3.示例地址

示例地址是该模板众多页面的一个示例代表,以该网址作为样例进行模板配置。通过对示例地址的配置,可以抓取与该地址在同一层级、具有相似结构的页面数据。一个模板只能填写一个示例地址。

对于模板1和其他模板,示例地址的填写有如下区别:

①模板01:示例地址默认填写为该任务的采集地址。

②其它模板:手动从众多网址中挑选一个粘贴进来。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值