最大化参数 火车头_火车头采集:网址参数设置教程[参数N]

看到标题时有没有一种相见恨晚的感觉?

小采之前没有想到会有用户在这里犯晕,直到我们的一位用户在后台留言几十条同我探讨这个问题,随后小采又在百度知道中,发现另一位用户也曾感到不解过,这才觉得十分有必要为大家再说明一下。

在此之前,小采提醒大神们,有任何疑问记得咨询客服。在QQ群、论坛、微信公众号,你们都可以第一时间获得帮助,如果没有秒回,希望您也能体谅下我们的客服MM,她们每天真的超级忙~

回归正题,让我们先看看火车采集器中的参数是什么、出现在哪里、怎么用……

[参数]在火车采集器中是一个标记标签,用来匹配某些待提取的信息。这里和(*)区分开来,(*)是通配符号,用来代表某些应被忽略的信息。

[参数]出现在内容网址获取和内容标签的正则提取中,如图:

关于[参数]、[参数1]、[参数N]?

这三者之间是什么样的存在?

如果hefei和food都是我们需要提取利用的内容,那么在写提取规则的时候我们就把它们标记为参数标签:http://www.dianping.com/[参数]/[参数]

而在拼接地址的时候就是对上面提取的参数进行利用,在这里我们提取到的参数已经进行了排序,所以hefei和food就分别为是我们提取到的[参数1]和[参数2]。但在写拼接地址的时候,我们会发现旁边出现的标签是[参数N]而不是[参数1]、[参数2],这是为什么呢?

其实[参数N]的作用是我们点击一次时就自动出现[参数1]、再点击就依次出现[参数2]、[参数3]……方便需要利用多个参数的情况。

如果依次出现的参数序号和拼接目标不同,我们还可自行修改数字调整参数位置,如上动态图片~

知道怎么用了,但具体用在什么地方呢?下面奉上大众点评中用参数拼接地址的真实操作案例:

进入商家列表页面后我们需要获取商家的地址,点击一个商家看看地址的格式。

回到列表页,查看页面源代码,可以发现商家的地址是不全的,因此我们需要借用源代码中的信息拼接出一个完整的内容页地址。这时源代码中的内容页地址信息就可以借助参数提取出来,不多说,看下图规则。

这里的[参数1]就是点击[参数N]后出来的哟,内容页地址拼接完成后我们来测试一下~

这样就拼接成功啦~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值