chrome插件上传csv_浏览器插件Web Scraper 爬取网页数据,秒杀八爪鱼

本文介绍了如何使用Chrome浏览器插件Web Scraper进行网页数据爬取,通过实例展示了从拉勾网抓取职位信息和在豆瓣电影获取评分Top250数据的步骤,操作简便,无需深入学习Python爬虫。
摘要由CSDN通过智能技术生成

对于文科生来说,系统学习python爬虫的话时间成本太高,有没有简单的爬虫软件呢?

当然有!现在市面上最流行的八爪鱼采集器,就是相对python简单的爬虫软件。不过,数据猿个人觉得这些都不算好用,因为它们可以爬取的网站有限,而且下载软件和学习软件也有点麻烦。

今天,程序猿给大家介绍一款Google浏览器插件——Web Scraper,作为插件的它非常方便使用,爬取的内容质量一点也不输八爪鱼。话不多说,安装插件,一睹为快吧!

本文目录如下:

ef0a0d18c70c4911ae28c18f817b7471.png

安装Web Scraper

  1. 进入Chrome 应用商店,选择在线安装;
  2. 如果下载时连接不上,也可以离线安装:
  • 访问 www.gugeapps.net 这个国内浏览器插件网站,搜索 Web Scraper,下载插件压缩包到本地;(也可以公众号后台回复Web Scraper获取安装包)
  • 将安装包解压缩;
  • 打开支持 Chrome协议的浏览器(首选Google 浏览器),网址框输入 chrome://extensions/ ,点击"加载已解压的扩展程序",选择解压的文件夹,将其导入浏览器插件中。
如果如下显示,即为安装成功。 (错误可不用理会) fa133c641d0228b8157b343da861a0dc.png Web Scraper的基本原理和python爬虫相似,学会了爬虫,这些也都相应比较熟悉。

9788bc1facf280f8ef75e24369c376a5.png

这次数据猿公布两个案例,一个是爬取拉勾网的职位数据,一个是豆瓣电影评分Top250。前者在没有抓包的情况下不能实现翻页,后者可以通过理解 url 来来修改 start_url 以实现翻页。

案例一:爬取拉勾网职位

启动Web Scraper
<
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值