提交数据网页设计_不会用Power Query爬取网页？大神亲自详细示范6个案例教会你！...

最新推荐文章于 2024-07-12 16:55:08 发布

weixin_39555715

最新推荐文章于 2024-07-12 16:55:08 发布

阅读量1k

点赞数

文章标签：提交数据网页设计

本文介绍了如何使用Power Query从网页中抓取数据，包括三种情况：1)翻页URL会变化，直接GET方式提交；2)翻页URL不变，通过F12找出真实地址；3)POST方式提交数据。通过实例详细讲解了每个步骤，适合初学者学习。

摘要由CSDN通过智能技术生成

原理见《PowerQuery爬取网页终极攻略——Power Query网络爬取详解》。施阳大神的手笔。pqfans是个好去处，有兴趣的可以多瞄瞄。

1、翻页URL会变化，直接get方式提交

URL:http://quote.stockstar.com/stock/ranklist_a_3_1_1.html

此为沪深A股数据，需要抓取1-20页的所有数据。点击下一页后观察URL发现，html前面最后一个数字即为页数，那么只需要自定义函数，将其做成变量然后调用即可。另外发现每一页的最后一行都是多余的，可以用Table.RemoveLastN删掉。

let get_data =(x)=>Table.RemoveLastN(Web.Page(Web.Contents("http://quote.stockstar.com/stock/ranklist_a_3_1_"&Text.From(x)&".html")){0}[Data],1), result = Table.Combine(List.Transform({1..20},get_data))in result

2、翻页URL不会变化，F12找出真实地址

URL:http://221.215.38.136/grcx/kscx/list.action?kscxVo.jsp=ylypmlcx.jsp

要抓取1-20页数据，但发现翻页URL不会变，无法根据URL控制页数。浏览器按F12发现，网页以get方式提交，图中参数4即为页数，表格的真实URL为http://221.215.38.136/grcx/pages/kscx/ylypmlcx.jsp?page_ylypmlcxQuery=4，于是方法同上。

最低0.47元/天解锁文章

weixin_39555715

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
提交数据网页设计_不会用Power Query爬取网页？大神亲自详细示范6个案例教会你！...

原理见《PowerQuery爬取网页终极攻略——Power Query网络爬取详解》。施阳大神的手笔。pqfans是个好去处，有兴趣的可以多瞄瞄。1、翻页URL会变化，直接get方式提交URL:http://quote.stockstar.com/stock/ranklist_a_3_1_1.html此为沪深A股数据，需要抓取1-20页的所有数据。点击下一页后观察URL发现，html前面最后一个数...
复制链接

扫一扫