好强的谷歌插件,不用写代码就能爬虫!

来源:量子位 | 公众号 QbitAI

家人们,要爬虫——现在用一个电子表格就行了。

1ce929dd24bd652714d4f44ded395ee5.png

一行代码也别写,第三方软件也甭安。

只需在表格里点几下就ok。

不信,你瞧:

就这么两下,网页上的商品信息都有了。

94eec88b82198e9ade02215f82ebb2d2.gif

网友看完都惊呆了,码个不停。

7bda0810471bb91f2d9f5aed3c22bda4.png

一看到这是来自谷歌的产品(Google Sheet,谷歌的“Excel”),大家就立马cue起了微软,问它慌不慌。

还有人称这是在“跨界打击”它。5b41e8d7a705e5ba22cfe8ce312dcfb4.png

974f7903f8aef9c713c6917c473a1323.png

 扫盲:“巨硬”就是微软,网友给的调侃

好不热闹。

来看具体怎么实现。

详细步骤

以爬亚马逊某个手机产品的商品页为例。

我们先打开谷歌Sheet(网友版即可),新建一个文档。

然后copy一下要爬的网址,粘进去。

45706b929d5e2cc3b1db77af69c95281.gif

剩下的都在Sheet里完成。

我们先列一下要爬的元素,这里依次为:

商品图片-识别码(asin,亚马逊给每个商品生成的唯一标识)-商品名-价格-评分-图片网址。

80f381f4239249e0275094b8350963d6.png

然后就可以正式开始爬了。

要诀就是一个叫做ImportFromWeb的函数。

它也是个插件,没有的需要先安装一下(安装地址放文末了),然后通过Google Sheet程序的“扩展程序”菜单导入就行。

c021bf176037b1cc6e3be44d4d11176c.png

我们只需把ImportFromWeb函数放进asin那一列,然后第一个参数选中刚刚粘过来的网址,第二个参数把要爬的元素单元格拖一遍(除了“图片”)。

稍等个1~2s,价格、商品名等信息就都出来了!

f61ac5ac9106c749698e3709b923d2b7.gif

还差图片。

简单~基操~

用IMAGE函数把G3格子里得到的图片网址值给过去就行。

03db9b920852e88d7f1143fd35e99e06.gif

至此,第一个商品页里的东西就爬到了。

唯一麻烦的是,如果还需要爬更多商品的信息,需要把商品网址挨个粘一遍。

然后就没啥了,除了给单元格地址的行标列标加一下绝对引用符“$”

这里可以不学视频,直接一个f4就行。

拖一下,全部搞定!

5240f5e1cca9ec085b08bb98aaf46a69.gif

怎么样?是不是非常方便。

f60e70eac70e277939cb00d4feb540a8.png

看完整个操作,你也发现了,其实就是谷歌写了个脚本给咱封装好了直接用。

而据官方介绍,这个ImportFromWeb功能还能自动更新爬取到的信息。

而且只要是用JS写的网站都可以爬(基本等于绝大数网站了),每个函数还可支持50个url,以及数千个数据点。

快点起来吧~

参考链接:
[1]https://weibo.com/1402400261/M9ZY84thO?filter=hot&root_comment_id=0&type=comment
[2]https://www.getapp.sg/software/2060417/importfromweb
[3]https://workspace.google.com/marketplace/app/importfromweb_web_scraping_in_google_she/278587576794(安装ImportFromWeb)

感谢大家一路的支持和厚爱,包邮送书5本

76953098132f8ad079cfc2a8b362065e.jpeg

有兴趣的同学可以在我们的下面小号上支持一下,抽奖福利一般都在小号上面。

77b4d0c9756a46e220b5ffddda426618.jpeg

扫码输入:1130

推荐阅读:
入门: 最全的零基础学Python的问题  | 零基础学了8个月的Python  | 实战项目 |学Python就是这条捷径
干货:爬取豆瓣短评,电影《后来的我们》 | 38年NBA最佳球员分析 |   从万众期待到口碑扑街!唐探3令人失望  | 笑看新倚天屠龙记 | 灯谜答题王 |用Python做个海量小姐姐素描图 |碟中谍这么火,我用机器学习做个迷你推荐系统电影
趣味:弹球游戏  | 九宫格  | 漂亮的花 | 两百行Python《天天酷跑》游戏!
AI: 会做诗的机器人 | 给图片上色 | 预测收入 | 碟中谍这么火,我用机器学习做个迷你推荐系统电影
小工具: Pdf转Word,轻松搞定表格和水印! | 一键把html网页保存为pdf!|  再见PDF提取收费! | 用90行代码打造最强PDF转换器,word、PPT、excel、markdown、html一键转换 | 制作一款钉钉低价机票提示器! |60行代码做了一个语音壁纸切换器天天看小姐姐!|
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值