如何使用Web Scraper爬虫抓取数据?

Web Scraper是一个基于Chrome/火狐浏览器的插件,能够在网页上自动爬取数据,提供了丰富的配置,支持自动翻页、登录认证、JavaScript渲染等等,可以解决多数爬虫难题。

Web Scraper的安装也很简单,在Chrome应用商店里搜索“Web Scraper”,找到该插件并点击“添加至Chrome”按钮。


安装好Web Scraper后,需要在开发者工具中使用它,按F12键打开开发者模式能找到Web Scraper功能区,在这里可以新建并配置爬虫,你也不需要写任何代码就能抓取数据。

下面讲讲如何用Web Scraper爬取抖音评论数据。

先F12打开开发者界面,点击Web Scraper按钮,会进入到操作界面。


接下来新建Sitemap name项目名称,英文随意取,Start URL就是想要爬取的网站的URL,输入完点击Create Sitemap。


然后点击“添加新的Selector”按钮,在网页中选择要爬取的数据所在的区域(如“抖音视频”模块中的评论区)。注意必须勾选Multiple,因为字样才会批量爬取。

在这里插入图片描述
这样对于评论的简单抓取设置就可以了,最后保存并导出评论数据。
在这里插入图片描述

使用Web Scraper需要对HTML结构有一定的了解,需要自己一步步去配置,可能对于初学者还有些门槛,适合IT从业者。而且Web Scraper抓取的数据形式有限,适合文本这样简单的数据需求,对于图片、视频就会比较困难。

  • 6
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

@Python大数据分析

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值