一、安装及简介
默认使用Chrome浏览器。
1、下载压缩包
官网:易采集EasySpider:无代码可视化爬虫/浏览器自动化测试软件
Linux版只适用于Ubuntu 20.04及以上版本、Deepin、Debian及其衍生版本。
(建议使用)下载网址/Github下载:Releases · NaiboWang/EasySpider · GitHub
选择需要运行的服务器对应的版本下载(我下载的是EasySpider_0.6.2_Linux_x64.tar.xz)
点击下载没反应,可以多试几次,可能网络不太好。
下载失败,点击“重试”。
2、运行
解压压缩包,打开终端,输入./easy-spider.sh
启动后的界面,
同时会弹出以下页面,根据个人情况选择语言,建议选择“中文”
同意并开始使用:
3、新建任务
(1)点击“设计/修改任务”,设计完成后才可以进行爬虫任务。
(2)选择“设计模式”,根据爬取网站是否需要登陆来判断用哪个模式。不需要登陆选【纯净版浏览器设计】,需要登陆则选择【带用户信息浏览器设计】即可。
(3)创建新任务,输入目标完整地址,点击“开始设计”
(4)设计流程:
设计流程打开的同时,网页也会打开。
(5)保存任务:输入任务名称,点击“保存”
(6)执行任务:
返回任务列表,点击“任务信息”,
点击“执行任务”
点击“本地直接执行”
(7)输出结果:位置压缩包Data里面EasySpider_Linux_x64/Data,
txt文件为程序运行日志,csv文件为爬取结果
csv文件:
二、在csdn的第1024天-收获
经过在csdn的1024天,我获得了以下成就,坚持总会有收获。
三、在csdn的第1024天-日常
我一周大概更新两篇文章,更新频率不固定,在工作中遇到了什么研究的领域,研究过后,就会形成文章,发布在csdn,一般包含Office的应用、Linux上部署软件、AI、学习中遇到的一些困难及解决办法等专栏。
关于easySpider的具体使用,后续会尽快更新。