用Excel,只需30秒就可爬取网站数据

是的,你没看错,就是用Excel爬数据。那么为什么要用它呢?因为它不需要写一行代码,只需要轻轻点几下鼠标,就可以得到你想要的数据,全程30秒左右就能搞定,在网站结构简单,需求比较简单的情况下,你只此一招就可以秒杀专业程序员,毕竟很多时候30秒恐怕程序员才刚刚打开专业代码编辑器,等待各种组件插件加载完成。哈哈哈~~~~,怎么样心动了吗?

0. 软件版本要求及先决条件

要求1 :Excel2016及以上版本,开箱即用。当然其他低版本,不是不可以,只是需要自己安装插件,爱折腾的可以自己尝试。

要求2:仅支持get请求(这一点不了解的人可以不管,可以简单的认为是那种你直接打开就能看到 的数据就是满足要求的)

要求3:你所需要的数据,在html网页的table标签中。不能是图片等。

那么如何知道是否在table标签中呢?很简单只需要在浏览器中看一下网页源代码,你需要的数据是否被包裹在(<td>数据</td> 或<th>数据</th>)这样的结构中,如果是,恭喜你,excel直接可以抓取,如果不是,那就用其他更专业的爬虫工具或者自己老老实实写代码吧。。。

下面展示一下查看数据是否在<td>(或<th>)标签中的操作:(随便找了个房价网站)

a.  浏览器打开网站,找到想要爬取的数据,按下键盘上的“F12”键(推荐使用谷歌浏览器、Edge浏览器、火狐浏览器),打开调试器。

b. 点击左上角的元素定位图标,然后将鼠标移动到你需要的数据上,就可以看到他们是否包含在<td>(<th>)中了。

 

上面的过程,是分析网站数据结构的过程,可以看到所需数据都包含在<th>标签中,这个过程是不可或缺的,不管你是利用工具爬取还是自己写代码爬取,这个过程极其重要。

假设你确定了,你想要的数据正好就在<td>(<th>)标签中,那么下面就看如何利用Excel爬取吧!

1. 打开Excel数据获取工具

 注:不同版本可能组件的名称或位置略有差异,我这里是Excel2019版,其他版本对比查找一下,确定的是都在“数据”这个选项卡下面。

2. 填写爬取参数

 这是基本模式,只需要把你要爬的网页网址粘贴过来即可,另一种高级模式可以设置更多的参数,比如请求头这些,有兴趣的可以自己探索。

注:不需要登录的网站直接匿名模式就可以

3. 获取数据

在该界面,选择需要的table点击,然后点击转换数据,就可以调用excel自带的power BI对数据进行各种自定义的处理转换,当然也可以直接加载,如果你不想做过多的转换或是想在excel中再处理的话。

下面的界面就是power query的界面,可以在这个界面进行各种高级的数据转换,也可以不操作, 假设你转换完了,直接点击“关闭并上载”即可。

 

 

OK , 想要的数据已经上载到excel中了,就是这么方便快捷。

今天的经验分享就到这里啦,有好的意见或建议,欢迎在评论区留言~~~~

 

 

  • 9
    点赞
  • 44
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值