八爪鱼采集数据的一般流程

在日常生活中常常需要用到各种数据, 下面是一个通过八爪鱼工具采集广州35路公交线的站点数据的案例

下载并打开八爪鱼(官网下载即可)

  1. 明确采集对象
    复制需要采集对象的网址粘贴至八爪鱼首页的网址输入框中, 点击开始采集
    在这里插入图片描述

  2. 配置采集流程
    打开右上角的流程按钮( 这个按钮默认是关闭的 )
    在这里插入图片描述

  3. 输入关键词并搜索
    在弹出的输入提示框中( 右边 ) 选择输入文字: 输入关键词, 确定保存, 八爪鱼自动将关键词填入输入框中, 并将这个步骤添加到流程中,
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    接下来点击搜索按钮(网页上), 在右边的自能提示框中选择[点击该按钮], 八爪鱼执行了这个操作, 添加到流程图中
    在这里插入图片描述
    在这里插入图片描述

  4. 采集全部需要的数据: 在八爪鱼中需要建立一个循环去完成
    选择第一个列表, 在弹出的提示框中选择选中子元素( 这里的子元素就是选中列表中的字段) 再在智能提示框中点击[ 选中全部 ], 继续点击[ 采集数据 ] , 观察流程图, 八爪鱼会自动地生成一个循环的提取数据的流程
    在这里插入图片描述
    在这里插入图片描述

下面会出现一个配置抓取数据的模版, 对于不需要的字段和数据, 我们可以点击删除, 还可以修改字段名称
在这里插入图片描述

  1. 实现翻页
    因为上面的这个流程采集的是第一页的数据, 我们还需要对通过以下的操作实现数据的翻页采集:
    选中并点击页面中的翻页按钮[ 下一页 ] , 在智能提示框中选中[循环点击下一页 ]
    在这里插入图片描述
    八爪鱼就在流程图中建立一个循环翻页部分
    在这里插入图片描述

  2. 设置向下滚动
    在流程图中选中[ 点击元素 ]步骤, 在下面勾选滚动页面, 设置滚动次数, 每次间隔, 滚动方式为向下滚动一屏, 点击确定保存
    在这里插入图片描述
    在这里插入图片描述

点击翻页步骤(流程图中),在右边勾选滚动页面, 设置滚动次数, 每次间隔, 滚动方式为向下滚动一屏, 点击确定保存
这样, 一个采集流程就配置好了

7.导出数据
启动采集 点击[ 采集 ]---->[ 启动本地采集 ] ---->数据采集完成后导出数据
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

爬取结果如下:
在这里插入图片描述
由于受各方面因素的影响, 导出来的数据不是很美观, 我们应该对数据进行清洗 , 保留我们需要的数据即可
我需要的数据是站点和坐标的数据 , 结果如下:

  • 17
    点赞
  • 110
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

稻田里展望者

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值