分析目标
- 目标网址
游记列表页: 13EA6B51D913B9E5CCDB05826F873938
游记详情页: CA0E5F46D3F1927840F99AA22CDBE20D - 内容:游记列表中获取详情页地址,并实现详情页爬取
- 逆向内容;加速乐(三次请求,cookie加密)
部分一:游记列表获取
常规操作就不在赘述,搜索关键字发现,没有找到相关请求包,在预览中查看每个包的响应预览,能够找到以下这个请求,返回了html状态的数据。
观察请求头和请求参数,发现没有需要进行加密的参数值,提取请求参数,发生变化的参数有page和_,其中有相关经验的人直接就可以看出来,这里的_参数就是时间戳,page就是页码。
params = {"params": json.dumps({"type":"0","objid":"0","page":str(page),"ajax":"1","