chrome后台扫描插件_一款简单好用的爬虫工具插件

6a27184e1d8fc3dbcd8f9119b038ba3c.gif

d06136d61865fb3573684459f8ab9d0b.png

软件介绍

Web Scraper是一款适合谷歌浏览器使用的网页数据提取插件,通过使用该插件,可以快速,有效,准确的提取页面数据。可任意选择抓取范围,让你想抓就抓随心所欲,并且还能将你所需要的数据转换为CSV文件转出,是一款不可多得的网页内容提取插件。

软件特点

1、刮多页

2、从动态页面

3、出口刮数据作为CSV

4、进口,出口的Sitemaps

5、只依赖于Chrome浏览器

6、提取数据(的JavaScript AJAX)

7、刮数据存储在本地存储或CouchDB的

8、浏览刮数据/> 3、多个数据选择类型

插件功能

使用多线程快速扫描任何网站

在WebScraper主窗口中,必须指定要扫描的网页的URL地址以及用于完成此过程的线程数。你可以借助一个简单的滑块来调整后面的参数。

为避免任何不必要的扫描,您可以选择仅抓取单个网页,然后通过简单的鼠标点击开始此过程。在实时查看窗口中,您可以看到每个链接返回的状态消息,这在处理调试任务时可能会很有用。

提取各种类型的信息,并将数据导出为CSV或JSON

在WebScraper输出面板中,您可以选择希望实用程序从网页中提取的信息类型:URL,标题,描述,与不同类或ID关联的内容,标题,页面内容各种格式(纯文本,HTML或MarkDown)和最后修改日期。

您还可以选择输出文件格式(CSV或JSON),决定合并空格,并在文件超出一定大小时设置警报。如果您选择采用CSV格式,则可以选择何时在列周围使用引号,采用引号替换引号或行分隔符类型。

最后但并非最不重要的是,WebScraper还允许您更改用户代理,设置链接数量和来自主页的点击数量的限制,可以忽略查询字符串,并可将根域的子域作为内部页面。

如何安装

首先当然电脑要有Google Chrome浏览器作为载体,对于浏览器版本没什么要求,安装最新版的即可。

Chrome插件有好几种安装方法,最简单的方法是在Google Store中直接下载。

使用教程

插件免费获取

1.关注本公众号:乔木未央(后续会有更多的神器和干货)

2:后台回复关键字:爬虫(后台自动获取,无需等待)

f6ffaabc13e69d0839a67a26a6a6a153.png

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值