不讲武德---不用代码爬虫

有人问,我不会代码,我能爬虫吗?我,很快啊,回答:可以!

不需要写代码的,那当然是需要工具了,较为熟知的爬虫工具有八爪鱼,和web scraper,这次我所使用的是web scraper。安装web scraper
,这篇文章讲述的算清晰的了。

开始操作:
当你下好后,打开浏览器,检查(或按F12)应该是张这个样子:如果是这样,那么说明你已经安装好了
在这里插入图片描述
那我们可以开始操作了:我们此次爬取的是豆瓣电影top250,对!就是这个刚学爬虫都要爬取的网站。

  • 第一步:先创建项目:注意名称必须是英文

在这里插入图片描述
在这里插入图片描述

  • 第二步:开始采集数据

在这里插入图片描述

当你点击了select后,直接在原网页上点击,最好点击整个元素框,点一两个程序就会自动补齐下面的选项框,当你看到红色的区域是符合你的预期的时候,点击done selecting,这时会发现有一串字符,会自动跑到文本框里。当操作完后点击save 进行保存即可
在这里插入图片描述
当这步操作完后,应该跟以下的界面一样:
在这里插入图片描述
之后点击contents进入到里面,进行真正意义上的采取数据:之后的操作跟之前一样,只不过这次type的类型是text,而不再是element,以及不用再对Multiple打钩
在这里插入图片描述
其中的name像这样:
在这里插入图片描述
需注意,这时点击select对网页进行选择的时候,你只能在网页的第一个框内进行点击:像这样
在这里插入图片描述
当你设置后所有字段后:你可以点击select graph进行类似于流程图的预览
在这里插入图片描述
点击data preview对数据进行预览,有不对的及时进行调整
在这里插入图片描述
当都没有问题,便可以对数据进行爬取。

  • 第三步:导出数据

点击scrapes进行对网页的爬取

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
然后这时,有人说,我不满意,你这个只能爬取一页,我要爬取多页数据,并且我还想爬取那种需要点击才能出数据的。
我,很快啊,回答:下次更,下次一定

  • 12
    点赞
  • 43
    收藏
    觉得还不错? 一键收藏
  • 11
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值