不讲武德---不用代码爬虫

最新推荐文章于 2023-07-09 13:16:54 发布

置顶叒枅

最新推荐文章于 2023-07-09 13:16:54 发布

阅读量3.6k

点赞数 12

文章标签：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44987290/article/details/110197787

版权

有人问，我不会代码，我能爬虫吗？我，很快啊，回答：可以！

不需要写代码的，那当然是需要工具了，较为熟知的爬虫工具有八爪鱼，和web scraper，这次我所使用的是web scraper。安装web scraper
，这篇文章讲述的算清晰的了。

开始操作：
当你下好后，打开浏览器，检查（或按F12）应该是张这个样子：如果是这样，那么说明你已经安装好了
在这里插入图片描述
那我们可以开始操作了：我们此次爬取的是豆瓣电影top250，对！就是这个刚学爬虫都要爬取的网站。

第一步：先创建项目：注意名称必须是英文

在这里插入图片描述

第二步：开始采集数据

在这里插入图片描述

当你点击了select后，直接在原网页上点击，最好点击整个元素框，点一两个程序就会自动补齐下面的选项框，当你看到红色的区域是符合你的预期的时候，点击done selecting，这时会发现有一串字符，会自动跑到文本框里。当操作完后点击save 进行保存即可
在这里插入图片描述
当这步操作完后，应该跟以下的界面一样：

之后点击contents进入到里面，进行真正意义上的采取数据：之后的操作跟之前一样，只不过这次type的类型是text，而不再是element，以及不用再对Multiple打钩

其中的name像这样：
在这里插入图片描述
需注意，这时点击select对网页进行选择的时候，你只能在网页的第一个框内进行点击：像这样

当你设置后所有字段后：你可以点击select graph进行类似于流程图的预览

点击data preview对数据进行预览，有不对的及时进行调整
在这里插入图片描述
当都没有问题，便可以对数据进行爬取。

第三步：导出数据

点击scrapes进行对网页的爬取

在这里插入图片描述

然后这时，有人说，我不满意，你这个只能爬取一页，我要爬取多页数据，并且我还想爬取那种需要点击才能出数据的。
我，很快啊，回答：下次更，下次一定

关注

12
点赞
踩
43

收藏

觉得还不错? 一键收藏
11
评论
不讲武德---不用代码爬虫

有人问我不会代码，我能爬虫吗？我，很快啊，回答：可以！不需要写代码的，那当然是需要工具了，较为熟知的爬虫工具有八爪鱼，和web scraper，这次我所使用的是web scraper。安装web scraper，这篇文章讲述的算清洗的了。开始操作：当你下好后，打开浏览器，检查（或按F12）应该是张这个样子：如果是这样，那么说明你已经安装好了我们可以开始操作了：...
复制链接

扫一扫

评论 11

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。