问题:诸葛找房的url=https://sz.ershoufang.zhuge.com/请求的cookie做了js加密。浏览器在请求网页时,需要请求两次,第一次是返回js生成cookies的源代码,我们需要从源代码中找到新的cookie,再把新的cookie发送请求才能访问到内容。
参考:2019年末逆向复习系列之努比亚Cookie生成逆向分析 - 知乎
巨坑:因为function setCookie,function reload(x)中含有settime,setinterval函数,会一直循环执行,因此如果执行function setCookie,function reload(x)会直接报如下错误。最好的办法是直接打断点,查找新的cookie是如何而来。
代码如下:
import re
import requests
from selenium.webdriver import Chrome
import execjs
import time
from requests import Session
from project.zhugezhaofang.js_arg2 import GET_agr2
from project.zhugezhaofang.get_proxy import get_proxy
from project.zhugezhaofang.User_agent import get_user_agent
url = '