不讲武德---不用代码爬虫

有人问,我不会代码,我能爬虫吗?我,很快啊,回答:可以!

不需要写代码的,那当然是需要工具了,较为熟知的爬虫工具有八爪鱼,和web scraper,这次我所使用的是web scraper。安装web scraper
,这篇文章讲述的算清晰的了。

开始操作:
当你下好后,打开浏览器,检查(或按F12)应该是张这个样子:如果是这样,那么说明你已经安装好了
在这里插入图片描述
那我们可以开始操作了:我们此次爬取的是豆瓣电影top250,对!就是这个刚学爬虫都要爬取的网站。

  • 第一步:先创建项目:注意名称必须是英文

在这里插入图片描述
在这里插入图片描述

  • 第二步:开始采集数据

在这里插入图片描述

当你点击了select后,直接在原网页上点击,最好点击整个元素框,点一两个程序就会自动补齐下面的选项框,当你看到红色的区域是符合你的预期的时候,点击done selecting,这时会发现有一串字符,会自动跑到文本框里。当操作完后点击save 进行保存即可
在这里插入图片描述
当这步操作完后,应该跟以下的界面一样:
在这里插入图片描述
之后点击contents进入到里面,进行真正意义上的采取数据:之后的操作跟之前一样,只不过这次type的类型是text,而不再是element,以及不用再对Multiple打钩
在这里插入图片描述
其中的name像这样:
在这里插入图片描述
需注意,这时点击select对网页进行选择的时候,你只能在网页的第一个框内进行点击:像这样
在这里插入图片描述
当你设置后所有字段后:你可以点击select graph进行类似于流程图的预览
在这里插入图片描述
点击data preview对数据进行预览,有不对的及时进行调整
在这里插入图片描述
当都没有问题,便可以对数据进行爬取。

  • 第三步:导出数据

点击scrapes进行对网页的爬取

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
然后这时,有人说,我不满意,你这个只能爬取一页,我要爬取多页数据,并且我还想爬取那种需要点击才能出数据的。
我,很快啊,回答:下次更,下次一定

已标记关键词 清除标记
©️2020 CSDN 皮肤主题: 数字20 设计师:CSDN官方博客 返回首页