破解难点:
1.所有接口参数都有时间限制,且与当前加载页面绑定,参数无法在短期内复用
2. token参数破解:点击翻页时第一个加载的接口,会返回一个token(详见:get_token() 函数内容)
3. hd参数破解:(最费劲的,看不懂也懒得看,直接全粘过来了放到js/js_guangming.js即可),翻页过程中会加载handle.js文件,负责加密大的函数是 function h2381766(_0x246303, _0x56cc70, _0x3bf5ca, _0x4f4675 ,_0x25f5d7),经过调试得到五个参数内容如函数get_hd() 所示
4. 解析结果,返回是jquery数据,正则表达式解析下即可,其中callback携带的参数即是接口返回时前边携带的参数,详见get_page() 函数
5. from sdk.utils.util_decorate import retry retry是自己写的重试装饰器,详细代码主页自己找去吧
#!/usr/bin/python3
# -*- coding:utf-8 -*-
from urllib import parse
import execjs
import requests
im