excel表格打不开是什么原因_用什么Phthon, Excel也可以网抓多页表格

本文介绍了如何利用Excel的PowerQuery功能抓取并导入网上多页表格数据。通过分析网址中的页码信息,创建自定义函数,结合空查询和递增序列,实现了从指定网页连续抓取10页数据并导入Excel的详细步骤。这个方法对于需要定期更新或整理网络数据的用户非常实用。
摘要由CSDN通过智能技术生成

原标题:用什么Phthon, Excel也可以网抓多页表格

最近python非常的火,动不动就秒杀excel,特别是从网上抓取数据十分吸人眼球。其实,Excel中的power query功能也可以网抓,甚至多页表格。兰色今天就带大家一起试上一试。

下图所示是Excel精英培训论坛的一个答疑交流版块。我们要导出前10页贴子信息到excel中。

90db810af76a6b410ae365fe37ff2a25.png

操作步骤:

1、分析网址中和页数有关的数字

通过手工翻页可以看出,网址最后一个数字正是和网页数相关的

http://www.excelpx.com/forum-38-2.html

d6df3231e800f7a37a5372f405df4f00.png

2、导入网页

数据(power query) - 自网站 - 粘贴网址并点高级 - 把网址最后的剪切并粘到下面的文本框中,然后点击确定按钮

b19c55da03c3617afa4e121e7f931924.gif

在新窗口中选取 table 1,然后点击右下的【 转换数据】按钮,即可把网页的第2页的贴子加载到power query编辑器中。

25a69c0f9a2ac7d7d95e4cdab735dd7e.gif

3、添加变量,制作自定义函数

在power query编辑中,点击【高级编辑器】

e5379aba9d8330fadeb6cc04909750b6.png

在代码最前添加一行代码,声明变量

(n as number) as table=>

然后把""修改为

&(n) & ".html"

修改后效果如下图所示:

6f5268027d83f05bd9a3ea4f1ff1c4ec.png

点击【完成】后会出现一个新的界面,你输入数字即可获取该页的数据。

c9fab143e41b31ff9fe31563a5fc1f54.gif

以上输入数字的查询只是为了测试,测试后可以删除,只留fx table 1

ba846e8917f78cdef90f3e69fe1b3773.gif

4、添加空查询

在左侧查询处单击右键 - 新建查询 - 其他源 - 空查询

5452d61e6f8bacd4a0fd94d5bd7299b1.png

在编辑栏中输入{1..10}并完成。

注:10是要导入的网页总页数,根据需要设置

再点左上按钮【到表】,弹出窗口默认并点确定

cf038f37f2930e4e5c5e74aad06203ba.gif

5、调用自定义函数生成查询

添加列- 调用自定义函数- 选取 table 1- 遇到隐私提示点 继续、忽略..,接下来会生成两列的表格。

7295050ce63fe17de3bebd2b260078a3.gif

点击第二列右端的安钮,展开数据表,就会生成所有网页中1~10页的贴子列表。

a3132b4f3f9f523f1c5306c2598044df.gif

6、导入到Excel表格中

文件 - 【关闭并上载】( 点【关闭并上载至 】则可以选择导入位置 )后,所有1~10的网页数据已全部导入到Excel表格中。

03520f55ce33677b0bdf4c73e4438f1b.gif

完工!

兰色说:网上多页表格导入步骤很多,也很难找到如本文这么详细步骤的教程,同学们一定要收藏起来备用。如果觉得好用,帮兰色分享出去让更多需要的人看到。返回搜狐,查看更多

责任编辑:

Python络爬虫与推荐算法新闻推荐平台:络爬虫:通过Python实现新浪新闻的爬取,可爬取新闻页面上的标题、文本、图片、视频链接(保留排版) 推荐算法:权重衰减+标签推荐+区域推荐+热点推荐.zip项目工程资源经过严格测试可直接运行成功且功能正常的情况才上传,可轻松复刻,拿到资料包后可轻松复现出一样的项目,本人系统开发经验充足(全领域),有任何使用问题欢迎随时与我联系,我会及时为您解惑,提供帮助。 【资源内容】:包含完整源码+工程文件+说明(如有)等。答辩评审平均分达到96分,放心下载使用!可轻松复现,设计报告也可借鉴此项目,该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的。 【提供帮助】:有任何使用问题欢迎随时与我联系,我会及时解答解惑,提供帮助 【附带帮助】:若还需要相关开发工具、学习资料等,我会提供帮助,提供资料,鼓励学习进步 【项目价值】:可用在相关项目设计中,皆可应用在项目、毕业设计、课程设计、期末/期中/大作业、工程实训、大创等学科竞赛比赛、初期项目立项、学习/练手等方面,可借鉴此优质项目实现复刻,设计报告也可借鉴此项目,也可基于此项目来扩展开发出更多功能 下载后请首先打开README文件(如有),项目工程可直接复现复刻,如果基础还行,也可在此程序基础上进行修改,以实现其它功能。供开源学习/技术交流/学习参考,勿用于商业用途。质量优质,放心下载使用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值