html做一个京东搜索功能,连续动作:自动搜索关键词采集信息—以京东为例

本文通过实例演示如何使用集搜客网络爬虫进行连续动作,自动在京东搜索关键词并采集商品的名称、价格和链接。首先定义一级规则,设置连续动作包括输入关键词和点击搜索,然后创建二级规则,标注和采集所需信息,最后在DS打数机中运行规则,获取搜索结果数据。
摘要由CSDN通过智能技术生成

一、操作步骤

如果网页上有搜索框,但是搜索结果页面没有独立网址,想要采集搜索结果,直接做规则是采集不到的,要先做连续动作(输入+点击)来实现自动输入关键词并搜索,然后才能采集数据。下面用京东搜索为例,演示自动搜索采集,操作步骤如下:

3c463c5fbe1006b61cc2892dff6977e0.png

二、案例规则+操作步骤第一级采集规则:连续动作_京东搜索

第二级采集规则:京东空调列表

样本网址:https://list.jd.com/list.html?cat=737,794,870

采集内容:京东商品的名称、价格、链接

注意:本案例京东搜索是有独立网址的,对于具有独立网址的页面,最简单的方法就是构造出每个关键词的搜索网址,然后把线索网址导入到规则里,就可以批量采集,而不是设置连续动作,可以参考《如何构造网址》和《如何管理规则的线索》。

第一步:定义第一级规则

335d8e5e672b41b1068c984ffa25752f.png

1.1打开集搜客网络爬虫,输入网址并Enter,加载出网页后再点击“定义规则”按钮,看到一个浮窗显示出来&

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值