【Python】EasySpider：一个很强大的可视化网络爬虫工具，100%开源完全免费

最新推荐文章于 2025-04-12 21:59:51 发布

iHero

最新推荐文章于 2025-04-12 21:59:51 发布

阅读量3.7w

点赞数 55

文章标签：爬虫信息可视化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ihero/article/details/130805504

版权

EasySpider是一个可视化爬虫软件，可以使用图形化界面，无代码可视化的设计和执行爬虫任务。只需要在网页上选择自己想要爬的内容并根据提示框操作即可完成爬虫设计和执行。同时软件还可以单独以命令行的方式进行执行，从而可以很方便的嵌入到其他系统中。自发布以来，已经有3.9K Star

一、下载安装EasySpider

支持Windows、MacOS、Linux系统安装。

下载地址：
https://github.com/NaiboWang/EasySpider/releases
在这里插入图片描述

下载完成后，如下图所示（macos安装为例）：
在这里插入图片描述

二、体验初探：获取ebay网站数据

1、设计任务

1）打开EasySpider主程序

在这里插入图片描述

2）点击【中文】

在这里插入图片描述

3）点击【设计任务】

在这里插入图片描述
然后这里选择【使用纯净版浏览器设计】，无需用户登录信息。

4）进入EasySpider设计窗口，大概过5秒钟后，会同时打开一个浏览器窗口

在这里插入图片描述

5）点击【新建任务】，输入ebay网址地址https://www.ebay.com，点击【开始设计】，打开ebay官网

在这里插入图片描述

6）输入搜索关键字：右击搜索框，点击【输入文字】按钮；输入搜索关键字，然后点击【确定】按钮

在这里插入图片描述

7）搜索：右击【搜索】按钮，点击【点击该按钮】，搜索出关于关键字“手机”的所有商品

在这里插入图片描述

此时会发现EasySpider主窗口的设计面板，会多出输入文字、点击元素两个动作，表示刚才的操作被加入当前任务队列中了。

8）采集标题：右击手机商品的标题，点击【选择全部】，这时所有的商品的标题都会选中；点击【采集数据】，则采集当前页面的手机商品标题的任务会被加入队列中

在这里插入图片描述

这时可以看到EasySpider主窗口的设计面板，又有新的任务加入。
在这里插入图片描述

9）循环点击下一页：页面滚动至底部，可以看到分页按钮；右击【下一页】按钮，点击【循环点击该链接】按钮

在这里插入图片描述

10）通过【剪切元素】调整任务顺序，实现循环点击下一页并循环相应页面的所有商品标题

在这里插入图片描述

最终采集步骤如下所示：

注意：执行步骤6至10过程中每个步骤可能会失败，单个步骤多重复操作1～2次就行

11）保存设计任务，关闭设计窗口，返回首页

在这里插入图片描述

2、执行任务

1）回到EasySpider首页，点击【查看执行任务】

在这里插入图片描述

2）点击【任务信息】

在这里插入图片描述

3）点击【调用任务】

在这里插入图片描述

4）修改执行任务条件，点击【本地直接执行】按钮；复制弹框里的执行脚本

在这里插入图片描述

在这里插入图片描述

5）打开easyspider_executestage程序，粘贴步骤5生成的脚本，然后静静地等待任务执行完成

在这里插入图片描述

6）最终获取的数据文件会保存在Data目录下

在这里插入图片描述
EasySpider官网地址：
https://github.com/NaiboWang/EasySpider

博客等级

码龄24年

144
原创

424
点赞

726
收藏

1098
粉丝

关注

私信

热门文章

分类专栏

WEB 8篇
Ubuntu 10篇
Jitsi Meet 1篇
Linux 18篇
PHP 4篇
AI 1篇
运维开发 9篇
Nginx 4篇
MySQL 2篇
Database 1篇
Java 学习 45篇
GitHub 5篇
MacOS 3篇
APP 1篇
ElasticSearch 1篇
dong

展开全部收起

最新评论

【Python】EasySpider：一个很强大的可视化网络爬虫工具，100%开源完全免费
blabla赞: 注意：执行步骤6至10过程中每个步骤可能会失败，单个步骤多重复操作1～2次就行。这个地方具体错误是什么呢
【Python】EasySpider：一个很强大的可视化网络爬虫工具，100%开源完全免费
blabla赞: Page: 2 检测到页面变化，继续循环。 Page changed detected, continue loop. 点击元素失败://*[contains(@class, "pagination__next")] ，请尝试将点击类型改为JavaScript点击后重试。 Failed to click element://*[contains(@class, "pagination__next")] , please try to change the click type to JavaScript Click. Message: stale element reference: stale element not found (Session info: chrome=131.0.6778.205); For documentation on this error, please visit: https://www.selenium.dev/documentation/webdriver/troubleshooting/errors#stale-element-reference-exception Stacktrace: GetHandleVerifier [0x00007FF63B84FB05+28789] (No symbol) [0x00007FF63B7B86E0] (No symbol) [0x00007FF63B65592A] (No symbol) [0x00007FF63B669F14] (No symbol) [0x00007FF63B6689C4] (No symbol) [0x00007FF63B65D109] (No symbol) [0x00007FF63B65D283] (No symbol) [0x00007FF63B65AF52] (No symbol) [0x00007FF63B65F4BF] (No symbol) [0x00007FF63B6F0910] 执行任务提示这个错误，可以解答一下吗
Java 程序基础之整数运算
zhic_zhong: 为什么11100000 00000000 00000000 00000000 = -536870912，为什么不是-（2^30+2^29）
【MySQL】MySQL分库定时备份脚本
qq_40282578: 定时任务那里要把第二行的命令添加到第一行命令打开的文件内，然后保存退出
【frp】新版本 frp 参考配置分享
iHero: 可以不用

大家在看

最新文章

目录

展开全部

收起

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

iHero 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。