使用webScraper 快速上手爬取数据（一）

入梦皆星河

已于 2023-07-13 18:57:21 修改

阅读量957

点赞数 1

分类专栏： chrome webscaper爬虫工具文章标签： chrome

于 2023-07-13 18:50:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_74136205/article/details/131709154

版权

chrome 同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

webscaper爬虫工具

1 篇文章 0 订阅

订阅专栏

web Scraper
简介下载
web Scraper是chrome中的一个插件，用来可视化爬虫，优点便是简单易操作，能满足小白的日常爬虫需求。可以做到不写代码进行爬取需要的数据

2023-07-13T09:38:20.png

在chrome浏览器中下载
若无法访问chrome，可以用Firefox浏览器作为替代来使用web scraper插件，下载安装Firefox浏览器
第一次简单爬取
任意进入一个页面，点击F12进入开发者后台。

2023-07-13T09:50:42.png

下面我们点击create new sitemap，然后点击create sitemap (创建网站地图)，打开后会有name和URL选项

2023-07-13T09:54:48.png

2023-07-13T09:58:12.png

第一次进行爬虫练习选择爬取哔哩哔哩首页的视频name

2023-07-13T10:08:06.png

点击create sitemap
然后Add new selector

2023-07-13T10:12:00.png

Select选择在页面进行操作：

2023-07-13T10:15:33.png

最后点击Save selector

2023-07-13T10:17:15.png

进行爬取

2023-07-13T10:18:13.png

设置页面加载延迟，防止访问太快

2023-07-13T10:22:34.png

然后点击start scraping开始爬取
当窗体一闪而过就说明爬取成功
可以去把爬取到的数据
下载到本地了

2023-07-13T10:26:15.png

由于bilibili每次打开都会刷新页面所以每次爬取到的name不一样
这就是进行简单使用web Scraper.
下面将会去学习如何将全部数据都爬取下来，以及控制链接参数实现翻页功能等。
**相比前面学习的爬虫框架之类的，这个插件可以说是大大提高工作效率（不用去写复杂代码了，提供了摸鱼时间）。有时站在巨人的肩膀上看世界还是很舒服的。**

入梦皆星河

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
使用webScraper 快速上手爬取数据（一）

web Scraper是chrome中的一个插件，用来可视化爬虫，优点便是简单易操作，能满足小白的日常爬虫需求。可以做到不写代码进行爬取需要的数据。**相比前面学习的爬虫框架之类的，这个插件可以说是大大提高工作效率（不用去写复杂代码了，提供了摸鱼时间）。下面我们点击create new sitemap，然后点击create sitemap (创建网站地图)，打开后会有name和URL选项。若无法访问chrome，可以用Firefox浏览器作为替代来使用web scraper插件，下载安装。
复制链接

扫一扫

专栏目录

入梦皆星河 CSDN认证博客专家 CSDN认证企业博客

码龄2年

52: 原创

17万+: 周排名

2万+: 总排名

3万+: 访问

: 等级

1022: 积分

392: 粉丝

472: 获赞

21: 评论

472: 收藏

私信

关注

热门文章

分类专栏

最新评论

TCP重传，滑动窗口，流量控制，拥塞控制
征途黯然.: 对TCP重传滑动窗口流量控制拥塞控制的解释非常详细和易懂。
TCP重传，滑动窗口，流量控制，拥塞控制
全栈小5: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰，图文并茂，详略得当，三连支持，期待博主持续输出好文【TCP重传，滑动窗口，流量控制，拥塞控制，博主这篇文章，值得一看】
学习mysql相关知识记录
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
TCP重传，滑动窗口，流量控制，拥塞控制
普通网友: 感谢大佬分享好文，学到了不少新知识，支持大佬，期待大佬持续输出优质文章！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
学习mysql相关知识记录
普通网友: 你的博客内容深入浅出，总是让我不再感到学习的困难，每一篇博文都是我学习的宝库。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。