【菜单式爬虫】八爪鱼爬虫笔记

本文介绍了八爪鱼爬虫的下载、官方视频教程,并分享了一些实用的小技巧,如使用指定cookie防止爬虫中断,利用页面滚动完整加载,通过循环获取网址等,适合初学者快速上手。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


最近因为爬取数据的需要,发现了可用性强的八爪鱼爬虫软件,是模拟人的行为,通过菜单式操作实现的。以此文简单记录遇到的一些问题及解决方案。

八爪鱼下载及官方视频教学

可以前往 八爪鱼官网,安装流程较为简洁,有官方教程学习,视频教学快速上手。个人感觉的优势在于:

  1. 可以菜单式操作,非常友好;
  2. 覆盖了大部分爬虫需求;
  3. 有不少成形模板,自定义配置也比较方便。

一些小的tips

1.使用指定cookie避免爬虫中断

在打开网页->高级设置->使用指定cookie,可以在登陆之后获取当前页面的cookie

2.使用页面滚动进行完整加载

在打开网页->高级设置->页面滚动,无内容更新时结束滚动

在这里插入图片描述

3.可以先获取网址,之后通过设置循环实现爬取

添加当前网址,这样的好处是后面可以回溯没有爬取成功的网址

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值