现在大家都是用python来实现网页数据爬取,但对于广大不会代码的小伙伴来说,要学Python代码,还要学html那些,起码需要一两个月学习才能摸透。今天给大家分享一个简单不用写代码20分钟就可以学会的网页数据获取的方法。工具就是用powerbi了~虽然很多网页有反爬虫功能,但通过powerbi,普通网站还是能简单实现数据爬取的。
Excel的功能和步骤跟powerbi的相一致,只不过excel并不能实现多网页数据爬取而且数据爬取并不方便。下面直接来干货:
Step1:选“文件”->选“获取数据”->选“Web”
![92bd7de5496cd7f9baecc582db80607d.png](https://i-blog.csdnimg.cn/blog_migrate/e9fba1215b275b98b4491564fabfc4d1.jpeg)
Step2: 选“高级”->填写URL-按“确定"
这里涉及一个问题,如果单页数据爬取,选”基本“填写URL就可以了。但涉及多页数据爬取就要选”高级“。以51job搜”数据分析师“为例,可以看到其URL唯一的区别就是标黄部分,因此就以此为分割,把一条URL分为3份,填入URL框中。
之后会有个匿名网页访问的,直接按确定就可以了。
![52c7b5db2b52fe3a75b4bb245f508fb5.png](https://i-blog.csdnimg.cn/blog_migrate/e2fbd81b2f8076f004dbf5015e5924b3.jpeg)