爬虫小工具合集|不会编程也能爬数据

最新推荐文章于 2024-08-24 11:00:06 发布

大数据v

最新推荐文章于 2024-08-24 11:00:06 发布

阅读量8.7k

点赞数 4

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zw0Pi8G5C1x/article/details/78758170

版权

本文介绍了两种无需编程技能的网页数据爬取方法：使用Microsoft Excel 2013的“自网站”功能和Google Sheet的=IMPORTHTML函数。通过简单步骤，用户可以轻松抓取并更新全国实时空气质量网站的数据。此外，还提及了一个名为you-get的Python项目，支持从多个网站下载资源。

摘要由CSDN通过智能技术生成

当前的主流爬虫手段是用Python编程，Python的强大毋庸置疑，但初学者学习Python还是需要一两个月时间的。有没有一些更简单的爬取数据方法呢？答案是有的，DataCastle为你准备了如下小工具，对于每个小工具你只需要花十几分钟时间，跟着我的步骤走一遍就可以掌握它啦~

一、Microsoft Excel

首先教大家一个用Excel爬取数据的方法，这里用的Microsoft Excel 2013版本，下面手把手开始教学~

（1）新建Excel，打开它，如下图所示

（2）点击“数据”——“自网站”

（3）在弹出的对话框中输入目标网址，这里以全国实时空气质量网站（http://www.pm25.in/rank）为例，点击转到，再导入

选择导入位置，确定

（4）结果如下图所示，怎么样，是不是很赞？

（5）如果要实时更新数据，可以在“数据”——“全部更新”——“连接属性”中进行设置，输入更新频率即可

最低0.47元/天解锁文章

关注

4
点赞
踩
35

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。