python 爬取生意参谋数据_用Excel实现生意参谋爬虫,伪装登陆状态

因为在Excel里面难以实现自动登录

今天介绍一种用PowerQuery爬取生意参谋数据的方法,只作学习用,拓展一下思维,切忌大量爬取生意参谋数据,以免被封!

需要用到M语言的几个函数:

Json.Document() 用来解析Json代码

Web.Contents(url,[Headers=headers,Query=query]) 用来获取页面数据

首先找到想要爬取的数据,此文以爬取生意参谋-首页-整体看板的数据为例。

0b0aa9c0c37007ca761bc697e8d01204.png

想要爬取数据,首先要找到数据在哪里。

鼠标右击网页任意位置,选择“审查元素,或者”按F12健。

705680f8eb472a2d2898093bfc63eb21.png

点击”Network”,然后点击”XHR”,数据就藏在左侧的文件中,可以依次点击查看。

4687b0572fb78bdd8586a2aa44c57030.png

发现数据在getTrend.json这个文件下,在Preview标签中可以看到我们要爬的数据。

接下来我们需要获取3部分内容,URL,Headers,Query。点击Headers标签。

69def295c72edd422d604c5a59af87c5.png

标红的部分是我们需要的内容(Headers部分从cookie开始复制,前面部分不需要),为便于编辑,可以把这3部分内容分别复制粘贴到记事本。

13823986cf000630eb29010a143e48e9.png

上图对代码的含义做了简单说明。接下来需要将3段内容进行简单的处理,以便PowerQuery能够正确识别。

先把输入法切换到英文状态。

  • 5
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值