1. 爬取网页表格类型的数据
注意:本文中所用excel版本是office 2016
案例一:从豆瓣上获取即将上映的电影列表
参考数据来源:https://movie.douban.com/coming
- 首先,新建一个excel的空表;然后,将网址复制到excel任意一个单元格中,如下图1-1所示:
图1-1 - 点击最上面一栏中的“数据”,选择该模块下的获取数据,然后选择自其他源中的自网站,详细步骤如图1-2,图1-3所示:
图1-2

- 然后将网址复制到URL下面的这个框中,然后点击确定,最终结果如图1-4所示:
图1-4 - 点击“显示选项”下的文件夹,然后点击下面的“Table 0”,得到的结果如图1-5所示:

还可以选择“表视图”旁边的“Web视图”来查看数据(这里便不做展示)
- 然后,点击下面加载隔壁的倒三角形,然后可以选择“加载”或者是“加载到”,如图1-6所示:

- 点击“加载到”会显示一个框,如下图图1-7所示:
图1-7 - 可以选择将数据导入新工作表中(默认勾选)或者是现有工作表中,这里以导入现有工作表为例子,数据导入的位置可以自由选择,如图1-8所示(只展示了一部分的数据):
图1-8 - 这样子便成功将豆瓣中即将上映的电影列表爬取到excel表格中 。
2. 自动更新爬取后得到的数据
案例二:从同花顺财经网,获取实时股票行情。
参考数据来源:http://q.10jqka.com.cn/
- 跟案例一中的步骤一样将数据爬取下来,结果如图2-1所示:
图2-1 - 然后选择“数据”选项卡下面的“全部刷新”中的“连接属性”,结果如图2-2,图2-3所示:
图2-2

- 然后,勾选“刷新频率”,将时间调至1分钟就可以了。可以按照自己的实际需求选择刷新的情况。结果如下图2-4所示:
图2-4 - PS:因为是在股票收市后写的文章,所以没有附上刷新后的结果图
注意: 本文中的案例以及Excel的使用方法均来自哔哩哔哩中的珞珈AI办公up主!!!
如若有侵权,请联系删除。
本文是作者个人学习后的总结,未经作者授权,禁止转载,谢谢配合。
珞珈AI办公https://space.bilibili.com/308552985