百度指数 爬虫 更新版

博主在2019年3月21日发现百度指数爬虫遇到数据缺失的问题,通过更换数据获取接口解决了该问题。文章提到了百度指数的更新导致的爬虫调整,包括模拟登录、获取关键参数、解析数据等步骤,并分享了部分思路和难点。文中还提及了百度对账号访问次数的限制策略。
摘要由CSDN通过智能技术生成

current time: 2019.3.21 正常

今天跑了一下数据,发现百度随机返回缺失的数据~~,这就有点坑了

对此 我们就只能更换获取数据的接口了,我们更改接口以后,就没有缺失数据的情况了!!!

 

 

current time: 2018.11.6 17.23 正常

昨天晚上有人跟我说百度指数更新了,今天看了下,更新了下代码

个人感觉是降低了难度,极大的减少了请求次数。这一次是直接根据参数 , 在js中生成数字

如果需要获取一段的平均值,只需要请求

http://index.baidu.com/api/SearchApi/index 这个参数就行,平均值直接返回 (这个是搜索指数,另外一个资讯指数 基本上就是一样的方式)

如果需要获取每一天的数值 就需要研究js了,一共有3个关键参数 

 

使用uniqid 请求

http://index.baidu.com/Interface/api/ptbk 得到第3个关键参数 as data2

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值