介绍一款好用又易学的爬虫工具:web scraper

[TOC]

web scraper

简介:

Web Scraper分为chrome插件和云服务两种,云服务是收费的,chrome插件是免费的,这里说的就是chrome插件这种。 Web Scraper插件,可以让你以“所见即所得”的方式挑选要提取的网页数据,形成模版,以后可以随时执行该模版,并且执行结果可以导出成Csv格式。 web scraper 比较类似selenium和火车头浏览器,不过web scraper功能要少的多,不过更加小巧,学习成本更低

优点

  • 抓取需要登录的数据较方便,因为这个插件是运行在浏览器上的。
  • 只要抓取频率慢一点,被网站屏蔽的概率较小,也因为是浏览器的原因,这就像是真实的用户访问一样。
  • 学习成本低

缺点

  • 好像并不能做验证码识别
  • 抓取效率较低,相对于爬虫程序来说,Web scraper没法大并发,快速切换IP等,所以大量级的数据抓取用Web Scrpaer不适合,慢慢抓大几千网页还是可以。
  • 插件本身是不支持配置定时任务的,云服务提供了这种功能,不过是收费的,到是可以尝试使用Python驱动谷歌来进而来操作web scraper的定时

下载地址:

webscraper.io/

crx文件:jnhgnonknehpejjnehehllkliplmbmhn_0_2_0_18.crx

操作

安装

谷歌浏览器

  • 打开google浏览器,进入应用

v2-13f3315f10c7165ec9c9c982847ba6c6_b.jpg


  • 点击网上应用商店

v2-7054c79f4aa9c37b5a2b24630fae052a_b.jpg


  • 输入框搜索web scraper,点击添加到chrome

v2-e94c260daddefda618162e7559327197_b.jpg


  • 安装完成

火狐浏览器

  • 点击右上角的菜单按钮,然后点击进入web开发者

v2-7d880e75cc7d6bfa19c6dccfffdc6442_b.jpg


  • 点击获取更多工具

v2-388f06c3e0d966464c2747e2ef4fd174_b.jpg


  • 在搜索框里输入web scraper进行搜索

v2-842f4e646e8da83c660d1034b6230075_b.jpg


  • 点击添加到 Firefox

v2-2a3606b41f68ad0ea6ef71d4cd615487_b.jpg



v2-5a9d3e1a3abfbef4069790cca071c219_b.jpg


使用说明

  • 进入谷歌浏览器,按F12进入开发者模式
  • 安装好web scraper插件之后呢,会在最后出现web scraper标示

v2-17da22e9749137466e73daecfb186cfe_b.jpg
  • 点击进入web scraper

v2-842f4e646e8da83c660d1034b6230075_b.jpg


  • 首先,我们点击create new sitemaps -->create sitemaps,来创建一个爬虫项目
  • 输入爬虫名称和需要采集的url,点击创建项目

v2-eb4bb3a5537d20a2651db75ffad047b9_b.jpg


  • 点击Add new selector创建一个选择器

v2-d92d912cf2ba35a095a87cc189197423_b.jpg


  • 配置相关参数

v2-3194aafba21b231f4252c43bc969dd0c_b.jpg


  • 运行爬虫,查看数据

v2-bba5df170cb665dd2463ff2ad8575b63_b.jpg

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

执笔人

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值