Python反爬之破解动态页面(二)

前言

上次我们讲到了破解一个简单的动态页面,post的元素是可以直接在源码里边找到的,然而大多数的时候,想服务器post的数据是需要经过复杂的加密逻辑生成的。这次我们就来分析一个经过加密的算法生成数据的页面。

正文

这次选取的目标是小说网站书旗,不过被阿里收购后,已经叫阿里文学了。


我们到书库里边用文字的形式查看一下书籍列表,这就是我们今天的分析对象了,如何获取这个列表的信息。


首先右键查看一下页面源码,果然是找不到这些信息的。于是F12,转到network界面,按照上一篇文章介绍的思路,很容易就找到了这样一个XHR,url结尾是“?r=pcapi/pcbook/librarysearch”,记住这个值我们等下会用到:


正好就是我们所需要的内容的json格式,只要获得了这些信息,书籍列表也就好说了。我们继续查看一下headers,发现是

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值