谷歌用c不用python_不用一行代码,就写了个爬虫!这款谷歌插件已经打包好了!...

前言

已经好几天没写原创了,这些天主要是在学习一些新的知识,所以没时间去写文。前几天发现了一个比较有用的谷歌插件,大家看标题也许已经知道它有啥用了。下面给大家介绍一下这款插件的用法,文末也提供了下载链接。

a35e41cd942fe4fdec05f87100db69eb.png

使用

首先简单介绍一下是个啥插件:

acfe2249adbab7115fe43b49098f2384.png

如图所示

确保安装成功插件后,我们就可以愉快的玩耍了。

98fb850402f497abbbf071ab15884c50.png

第一步,打开熟悉的开发者工具。

fe4afb140b7a1d913f59d8d7918815c2.png

可以看到,最右边多了一个webscrapyer的选项栏。

找到地方后,我们找个网站来爬爬。

95135986b5c35c355a82597c6a26fbf8.png

我这里找的是菜鸟笔记的网站,地址扔给大家,大家可以先拿它练练手。

https://www.runoob.com/w3cnote

接下来怎么做呢?

dd37a605e981bdbcc77ff4d5df25496f.png

点击Create Sitemap创建一个项目。

a2f239b469f2cec488810662390c38b4.png

填写相关信息,在开始url那个框里,可能大家注意到后面加了个[1-10:1]这代表着我要爬取前十页的数据。这里也是对url进行了一个简单的分析。

306f8a28d91c2a0a5a7dae0c1137a97f.png

创建完成,增加一个选择器。

由于,我这里只是简单的给大家操作一下怎么爬取,所以我这里就爬取前十篇文章中的标题,插件了也有很多的爬取方式,大家可以试一试。

633342bafe9c7013bc02530c5b5cb441.png

首先我们锁定外面的红框

b42a32bcba6474bdb5c0db4b33243678.png

921062bc8d71381adf9e5b6f8142b5e0.png

大家按照我的图片上操作,选择自己要爬取的元素。

31b61150ac1dc62b4338e2cb94f767f3.png

保存之后

a5fbcf97a8780ddebe2bef0d69dc2172.png

点击id,进行下一步选定爬取元素。

e5e951508e0d959abff7e40059d61a19.png

9b945efc47406e75b634b3fb8cbbe59f.png

选定标题后,记得选择父节点,保存。

完事之后,我们就可以愉快的运行了!

ecf92f63a07adf845ddaf0ceabf91975.png

点击爬取。等待它自动爬取。

0af3521e4e4e74abd469f70b838a8eaf.png

过一小会就可以看到数据了,数据支持导出!

总结

这个插件对于一些简单的静态爬虫还是处理的很不错的。不用写一行代码,可以节省我们的时间,直接点几下鼠标就能写个简单的爬虫,所以推荐给大家。

获取方式

① 可以去谷歌拓展程序商城下载

② 我也给大家打包好了,直接在公众号后台发送插件即可领取。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值