用Excel/Power Query能爬取网页表格数据 方法一
开始
本方法是本人借助网上的方法然后自己实操了一遍,记录一下。
如果网页中表格数据较少,需要的体力活不多,可以直接进行保存,不需要进行过多的技术操作。
但如果网页中表格数据分页太多或数据量太大,需要体力活太多,那您可以试下下列方法。
需求
爬取网页上的表格数据,保存到本地excel中。
准备数据到Excel
准备爬取下列链接中的表格数据
链接: 2019年财富世界500强排行榜
网页表格预览如下:
- 打开需要爬取的网页,在网页上 点击鼠标邮件 选择 查看网页源码
也可以直接快捷键Ctrl + U (Microsoft Edge)
如下图:
- 复制下图中内容到office 365中的Excel中,注意标签完整性以达到复制的数据完整性: