一、学习内容
二、学习过程
1.界面初识
1.界面初识 下载好之后出现界面 2.输入要爬取数据的网址
3.界面右下角出现图3所示后,开始自动识别,爬取数据。 4.识别数据完成后,点击生成采集设置5.界面右下方出现弹框,点击“保存并开始采集”6.点击启动本地采集后,开始采集爬取的信息7.运行过程中提取数据的界面 8.在提取数据过程中可以根据需要随时停止采集,结束运行,导出数据,
9.可以选择导出的格式
10.点击保存的文件,可以看到爬取的数据 三、学习思考
1.体验了八爪鱼采集后,你觉得它能够用在学习和工作中的哪些方面?
我觉得运用八爪鱼采集可以快速检索我们学习或者工作过程中需要的词条,节省时间
2.推测一下,你觉得八爪鱼的工作原理是什么? 运用c语言,通过模拟人的思维操作方式(如打开网页,点击网页中的某个按钮),对网页内容进行全自动提取。
3.和python爬虫相比,八爪鱼的优势和劣势是什么?
优势:不需要编程基础,对小白很友好,掌握操作流程就可以快速上手,短时有效地爬取所需数据劣势:爬取的数据有限;